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La  búsqueda  de  soluciones  reales  ha  cautivado  la  atención  de  los  matemáticos  desde  sus  primeros  tiempos, 
ocupando  un  lugar  importante  en  el  estudio  de  las  matemáticas.  Encontrar  una  solución  exacta  de  un  problema 
puede  llegar  a  ser  imposible,  o  puede  que  no  podamos  encontrar  una  respuesta  de  forma  conveniente  en  una 
gran  cantidad  de  aplicaciones  reales.  Cuando  esto  ocurre,  perseguiremos  dar  respuestas  útiles  que  involucren 
la  búsqueda  de  resultados  aproximados  suficientemente  buenos.  Esta  es  la  razón  de  los  métodos  numéricos, 
teniendo  muchos  de  ellos  una  larga  historia. 

Los  métodos  numéricos  son  técnicas  matemáticas  que  se  utilizan  para  resolver  problemas  matemáticos 
que  no  se  pueden  resolver,  o  que  son  difíciles  de  resolver,  analíticamente.  Una  solución  analítica  es  una 
solución  exacta  que  tiene  la  forma  de  una  expresión  matemática  en  función  de  las  variables  asociadas  al 
problema  que  se  quiere  resolver.  Una  solución  numérica  es  un  valor  numérico  aproximado  (un  número)  de  la 
solución.  Aunque  las  soluciones  numéricas  son  aproximaciones,  pueden  ser  muy  exactas.  En  muchos  métodos 
numéricos  los  cálculos  se  ejecutan  de  manera  iterativa  hasta  que  se  alcanza  una  exactitud  deseada,  de  manera 
que  tienen  que  ser  lo  suficientemente  exactos  como  para  satisfacer  los  requisitos  de  los  problemas  a  resolver 
y  lo  suficientemente  precisos  para  ser  adecuados. 

El  origen  de  este  texto  es  un  curso  introductorio  de  métodos  numéricos  que  lleva  impartiendo  el  autor  en  la 
Universidad  de  La  Rioja  desde  el  curso  2006-2007.  El  texto  proporciona  una  introducción  a  los  fundamentos 
más  básicos  de  los  métodos  numéricos  y  a  su  utilidad  para  resolver  problemas,  ofreciendo  una  primera  toma 
de  contacto  que  sirva  para  conocer  una  parte  del  amplio  catálogo  que  existe  de  métodos  numéricos.  El  objetivo 
principal  es  poner  a  disposición  de  los  estudiantes  unas  notas  de  fácil  lectura  con  una  colección  de  ejercicios 
que  amplíen  y  refuercen  lo  que  aprenden.  Otras  obras  más  completas,  véanse  las  referencias  bibliográficas, 
que  contengan  desarrollos  teóricos  y  mayor  número  de  ejemplos  son  un  complemento  ideal  a  este  texto. 

El  texto  va  dirigido  a  estudiantes  universitarios  que  van  a  utilizar  los  métodos  numéricos  por  primera  vez 
y  que  no  tienen  conocimientos  previos  de  los  mismos.  Se  presentan  métodos  numéricos  elementales  de  una 
manera  asequible  y  sin  ser  tratados  de  forma  sistemática,  de  manera  que  este  texto  se  pueda  utilizar  como 
guía  inicial  para  un  proceso  posterior  que  profundice  en  los  métodos  numéricos  de  manera  más  detallada  y 
extensa.  A  la  hora  de  redactar  el  texto  se  ha  tenido  presente  en  todo  momento  a  los  estudiantes  a  los  que 
está  dirigido. 

Los  requisitos  mínimos  son  el  cálculo  elemental,  incluyendo  los  polinomios  de  Taylor,  el  álgebra  matricial 
y  tener  nociones  básicas  de  programación  estructurada.  Para  los  capítulos  6  y  7  es  conveniente  saber  algo  de 
ecuaciones  diferenciales  ordinarias.  Y  para  el  capítulo  8  es  aconsejable  leerse  antes  el  complemento  B  si  no 
se  han  visto  con  anterioridad  las  ecuaciones  diferenciales  en  derivadas  parciales. 

Entre  los  objetivos  de  este  texto  marcamos  dos:  su  fácil  comprensión  para  estudiantes  universitarios  con 
un  conocimiento  mínimo  de  matemáticas  e  instruir  a  los  estudiantes  para  que  practiquen  con  los  métodos 
numéricos  en  un  ordenador.  Se  ha  intentado  exponer  los  conceptos  de  una  manera  clara  y  sencilla,  con  muy 
pocos  resultados  teóricos  formalmente  enunciados  y  sin  demostraciones. 

En  todos  los  capítulos  se  ha  intentado  ilustrar  cada  método  numérico  descrito  con  un  ejemplo,  que 
habitualmente  ha  sido  desarrollado  previamente  en  alguna  de  los  textos  que  aparecen  en  la  bibliografía,  con 
el  objetivo  claro  de  animar  a  los  estudiantes  a  tomar  contacto  con  obras  de  referencia  sobre  la  materia. 
También  al  final  de  cada  capítulo  se  han  añadido  unas  sugerencias  bibliográficas  y  una  colección  de  ejercicios 
propuestos  con  el  objetivo  de  incitar  a  los  estudiantes  a  que  planteen  problemas,  comprendan  los  recursos 
teóricos  necesarios  y  utilicen  los  métodos  numéricos  adecuados  para  resolver  los  problemas.  Además  se  ha 
pretendido  que  el  texto  sirva  de  autoaprendizaje  para  los  estudiantes. 

Los  temas  tratados  constituyen  materia  suficiente  para  un  curso  introductorio  sobre  métodos  numéricos, 
y  están  organizados  en  torno  a  tres  partes,  cada  una  de  las  cuales  está  dividida  en  capítulos.  Se  empieza 
con  temas  sencillos  y  poco  a  poco  se  van  complicando.  En  los  cinco  primeros  capítulos  se  desarrollan  las 
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técnicas  más  básicas  de  los  métodos  numéricos.  Los  dos  siguientes  están  dedicados  a  la  resolución  numérica  de 
ecuaciones  diferenciales  ordinarias.  Y  el  último  versa  sobre  la  resolución  numérica  de  ecuaciones  diferenciales 
en  derivadas  parciales. 

La  primera  parte  del  texto  comienza  con  un  capítulo  introductorio  en  el  que  se  hace  especial  hincapié  en 
el  papel  tan  importante  que  juegan  los  errores  a  la  hora  de  implementar  métodos  numéricos  en  un  ordenador 
para  resolver  problemas.  Para  ello  se  recuerdan  los  polinomios  de  Taylor  y  cómo  se  calculan  y  almacenan 
los  números  en  un  ordenador.  El  capítulo  2  trata  sobre  los  métodos  numéricos  básicos  para  resolver  sistemas 
de  ecuaciones  lineales,  distinguiendo  entre  métodos  directos  y  métodos  iterativos.  El  capítulo  3  describe  los 
métodos  iterativos  más  conocidos  para  resolver  ecuaciones  no  lineales,  así  como  la  resolución  de  sistemas  no 
lineales  mediante  el  método  de  Newton.  En  el  capítulo  4  se  estudia  la  interpolación  polinómica  de  Lagrange, 
la  interpolación  mediante  funciones  splines  y  la  aproximación  de  mínimos  cuadrados.  El  capítulo  5  analiza  la 
derivación  y  la  integración  numéricas  a  partir  del  polinomio  de  interpolación,  describiendo  diversas  fórmulas, 
tanto  para  las  derivadas  como  para  las  integrales. 

La  segunda  parte  del  texto  está  dedicada  a  las  ecuaciones  diferenciales  ordinarias.  El  capítulo  6  abarca  los 
problemas  de  valor  inicial,  examinado  los  métodos  de  un  paso  y  los  métodos  multipaso,  tanto  explícitos  como 
implícitos,  incluyendo  métodos  predictor-corrector,  y  terminando  con  la  extensión  a  ecuaciones  diferenciales 
de  orden  superior  y  sistemas  de  ecuaciones  diferenciales.  El  capítulo  7  describe  métodos  numéricos  para 
resolver  problemas  de  valores  en  la  frontera  en  dos  puntos,  discutiendo  los  métodos  de  disparo  y  los  de 
diferencias  finitas,  distinguiendo  los  casos  lineal  y  no  lineal. 

La  tercera  parte  del  texto,  que  comprende  el  capítulo  8,  repasa  los  métodos  numéricos  para  resolver 
ecuaciones  diferenciales  en  derivadas  parciales,  describiendo  métodos  numéricos  basados  en  la  aproximación 
por  diferencias  finitas  que  son  de  dos  tipos:  explícitos  e  implícitos.  También  se  hace  una  pequeña  introducción 
al  método  de  los  elementos  finitos. 

Además  de  cubrir  los  temas  estándares  desarrollados  en  los  capítulos  1-8,  se  han  añadido  dos  complementos 
que  los  completan.  El  primero  se  dedica  a  la  aproximación  de  valores  y  vectores  propios  mediante  el  método  de 
la  potencia.  En  el  segundo  se  introducen  las  ecuaciones  diferenciales  en  derivadas  parciales,  que  habitualmente 
no  se  encuentra  en  textos  de  métodos  numéricos,  pero  que  aquí  nos  ha  parecido  interesante  recordar  debido 
a  que  a  veces  algunos  estudiantes  universitarios  no  las  han  visto  con  anterioridad. 

Al  final  hemos  adjuntado  la  bibliografía  básica  utilizada  para  elaborar  este  texto,  junto  con  una  bibliografía 
complementaria  con  la  que  los  estudiantes  puedan  trabajar  a  la  hora  de  profundizar  en  los  métodos  numéricos. 
También  pueden  encontrar  por  su  cuenta  múltiples  referencias  electrónicas  en  Internet.  Una  buena  forma  de 
comenzar  es  visitando  las  páginas  de  Wikipedia:  http://es.wikipedia.org/wiki/Analisis_numerico  (en 
español)  y  http://en.wikipedia.org/wiki/Numerical_analysis  (en  inglés). 

Finalmente,  quiero  dar  las  gracias  de  forma  especial  a  Mario  Escario  Gil,  que  durante  los  dos  años  que 
estuvo  impartiendo  docencia  en  la  Universidad  de  La  Rioja  dió  clases  de  métodos  numéricos  y  elaboró  la 
sección  dedicada  a  la  introducción  del  método  de  los  elementos  finitos.  Para  terminar  quiero  dejar  constancia 
de  mi  agradecimiento  al  profesor  Miguel  Ángel  Hernández  Verón  por  inculcarme  su  interés  por  los  métodos 
numéricos  y  mostrarse  siempre  dispuesto  para  la  reflexión  y  el  buen  entendimiento  de  los  mismos. 


Logroño,  enero  de  2012 


J.  A.  E.  F 
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Capítulo  1 


Preliminares  matemáticos  y 
computacionales 

1.1.  Introducción 

En  este  texto  se  estudian  problemas  que  se  pueden  resolver  mediante  métodos  de  aproximación,  técni¬ 
cas  que  se  conocen  genéricamente  como  métodos  numéricos.  Empezamos  considerando  algunos  aspectos 
matemáticos  y  computacionales  que  aparecen  cuando  se  aproxima  la  solución  de  un  problema. 

Dos  son  los  objetivos  de  este  capítulo.  El  primero  es  revisar  algunos  conceptos  y  términos  fundamentales 
del  cálculo  y  del  álgebra  matricial,  que  son  útiles  en  la  obtención  de  los  métodos  numéricos  en  sí  mismos,  y  que 
sirvan  como  recordatorio  de  los  conceptos  con  los  que  se  supone  que  los  estudiantes  están  familiarizados.  Y  el 
segundo  es  presentar  algunos  conceptos  preparatorios  importantes  para  el  estudio  de  los  métodos  numéricos. 

Como  todos  los  métodos  numéricos  tienen  la  importante  característica  de  que  cometen  errores,  hay  dos 
cosas  que  se  deben  tener  en  cuenta  fundamentalmente  a  la  hora  de  aplicar  un  método  numérico  para  resolver 
un  problema.  La  primera,  y  más  obvia,  es  obtener  la  aproximación.  La  segunda,  pero  igualmente  importante, 
es  establecer  la  bondad  de  la  aproximación;  es  decir,  disponer  de  alguna  medida,  o  por  lo  menos  de  una  cierta 
idea,  de  su  grado  de  exactitud.  También  es  importante  destacar  una  de  las  dificultades  habituales  que  surgen 
cuando  se  usan  técnicas  para  aproximar  la  solución  de  un  problema:  ¿dónde  y  por  qué  se  producen  errores 
en  las  operaciones  aritméticas  y  cómo  se  pueden  controlar?  Es  fundamental  entonces  identificar,  cuantificar 
y  minimizar  dichos  errores.  Otro  de  los  aspectos  a  tener  en  cuenta  a  la  hora  de  aplicar  un  método  numérico 
para  resolver  un  problema  es  el  coste  operacional  de  los  procesos  numéricos. 

Para  las  demostraciones  y  un  mayor  detalle  pueden  consultarse  0,  m  y  m- 

1.2.  Un  recordatorio  de  cálculo 

Comenzamos  el  capítulo  con  un  repaso  de  algunos  aspectos  importantes  del  cálculo  que  son  necesarios  a 
lo  largo  del  texto.  Suponemos  que  los  estudiantes  que  lean  este  texto  conocen  la  terminología,  la  notación  y 
los  resultados  que  se  dan  en  un  curso  típico  de  cálculo. 

1.2.1.  Límites  y  continuidad 

El  límite  de  una  función  en  un  punto  dado  dice,  en  esencia,  a  qué  se  aproximan  los  valores  de  la  función 
cuando  los  puntos  de  su  dominio  se  acercan  a  dicho  punto  dado,  pero  éste  es  un  concepto  difícil  de  establecer 
con  precisión.  La  noción  de  límite  es  esencial  para  el  cálculo  infinitesimal. 

•  Decimos  que  una  función  f{x)  definida  en  un  conjunto  S  de  números  reales  tiene  límite  L  en  el  punto 
x  =  Xo,  lo  que  denotamos  por 

lím  f(x)  =  L, 

X — >Xq 

si  dado  cualquier  número  real  e  >  0,  existe  un  número  real  6  >  0  tal  que  \f(x)  —  L\  <  e  siempre  que 
0  <  \x  —  Xo\  <5.  (Esta  definición  asegura  que  los  valores  de  la  función  estarán  cerca  de  L  siempre  que  x  esté 
suficientemente  cerca  de  ¡eq). 
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•  Se  dice  que  una  función  es  continua  en  un  punto  de  su  dominio  cuando  el  límite  en  dicho  punto  coincide 
con  el  valor  de  la  función  en  él.  Es  decir,  una  función  /( x)  es  continua  en  el  punto  x  =  xq  si 

lím  /(x)  =  f(x o), 

X — >Xo 

y  se  dice  que  /  es  continua  en  el  conjunto  S  si  es  continua  en  cada  uno  de  los  puntos  de  S.  Denotaremos 
el  conjunto  de  todas  las  funciones  /  que  son  continuas  en  S  por  C(S).  Cuando  S  sea  un  intervalo  de  la  recta 
real,  digamos  [a,  b],  entonces  usaremos  la  notación  C[a,b ]. 

•  El  límite  de  una  sucesión  de  números  reales  o  complejos  se  define  de  manera  parecida.  Decimos  que  una 
sucesión  {xn}^L1  converge  a  un  número  x ,  lo  que  se  escribe 

lím  xn  =  x  (o  bien,  xn  — >  x  cuando  n  — >  oo), 

n — too 

si,  dado  cualquier  e  >  0,  existe  un  número  natural  N(e)  tal  que  \xn  —  x\  <  e  para  cada  n  >  N(é).  Cuando 
una  sucesión  tiene  límite,  se  dice  que  es  una  sucesión  convergente. 

•  Continuidad  y  convergencia  de  sucesiones.  Si  f(x)  es  una  función  definida  en  un  conjunto  S  de 
números  reales  y  xq  £  <S,  entonces  las  siguientes  afirmaciones  son  equivalentes: 

a.  /(x)  es  continua  eni  =  Xo, 

b.  Si  {in}“=1  es  cualquier  sucesión  en  S  que  converge  a  xq,  entonces  lím  f(xn)  =  f{x o). 


•  Teorema  del  valor  intermedio  o  de  Bolzano.  Si  /  €  C[a,  b]  y  (  es  un  número  cualquiera  entre  f(a)  y 
/ (6) ,  entonces  existe  al  menos  un  número  c  en  (a,  b)  tal  que  /(c)  =  i.  Véase  la  figura  0 


Figura  1.1:  Teorema  del  valor  intermedio  o  de  Bolzano. 


•  Todas  las  funciones  con  las  que  vamos  a  trabajar  en  la  discusión  de  los  métodos  numéricos  serán  continuas, 
ya  que  esto  es  lo  mínimo  que  debemos  exigir  para  asegurar  que  la  conducta  de  un  método  se  puede  predecir. 


1.2.2.  Derivabilidad 


•  Si  f[x)  es  una  función  definida  en  un  intervalo  abierto  que  contiene  un  punto  xq,  entonces  se  dice  que  f(x) 
es  derivable  en  x  =  Xq  cuando  existe  el  límite 


f'(xo) 


lím 

X — >Xq 


f(x)  -  f  Oo) 

X  —  Xq 


El  número  f'(x o)  se  llama  derivada  de  /  en  io  y  coincide  con  la  pendiente  de  la  recta  tangente  a  la  gráfica 


de  /  en  el  punto  (xq,  /(xq)),  tal  y  como  se  muestra  en  la  figura  1.2 


Una  función  derivable  en  cada  punto  de  un  conjunto  S  se  dice  que  es  derivable  en  S.  La  derivabilidad 
es  una  condición  más  fuerte  que  la  continuidad  en  el  siguiente  sentido. 
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y 


Figura  1.2:  Derivada  de  una  función  en  un  punto. 


•  Derivabilidad  implica  continuidad.  Si  la  función  f(x)  es  derivable  en  x  =  Xo,  entonces  f(x)  es  continua 
en  x  =  Xq- 


•  El  conjunto  de  todas  las  funciones  que  admiten  n  derivadas  continuas  en  S  se  denota  por  C n(5),  mientras 
que  el  conjunto  de  todas  las  funciones  indefinidamente  derivables  en  S  se  denota  por  C°°(S).  Las  funciones 
polinómicas,  racionales,  trigonométricas,  exponenciales  y  logarítmicas  están  en  C°°(S),  siendo  S  el  conjunto 
de  puntos  en  los  que  están  definidas. 


•  Teorema  del  valor  medio  o  de  Lagrange.  Si  /  £  C[a,b]  y  es  derivable  en  ( a,b ),  entonces  existe  un 
punto  c  en  (a,  b)  tal  que 


f’(c) 


m  -  ña) 

b  —  a 


Geométricamente  hablando,  véase  la  figura  [T73|  el  teorema  del  valor  medio  dice  que  hay  al  menos  un  número 
c  £  (a,b)  tal  que  la  pendiente  de  la  recta  tangente  a  la  curva  y  =  f{x)  en  el  punto  (c, /(c))  es  igual  a  la 
pendiente  de  la  recta  secante  que  pasa  por  los  puntos  (a,  /(a))  y  (b,  f(b)). 


y 


Figura  1.3:  Teorema  del  valor  medio  o  de  Lagrange. 


•  Teorema  de  los  valores  extremos.  [Este  resultado  se  usa  frecuentemente  para  establecer  cotas  del  error 
cometido].  Si  f  £  C[a,b\,  entonces  existen  ci  y  c 2  en  (a,b)  tales  que  /(ci)  <  /( x)  <  /(C2)  para  todo  x  en 
[a,  b ].  Si  además,  /  es  derivable  en  (a,  b),  entonces  los  puntos  ci  y  C2  están  en  los  extremos  de  [a,  b]  o  bien  son 
puntos  críticos,  es  decir,  puntos  en  los  que  /'  se  anula. 
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1.2.3.  Integración 

•  Primer  teorema  fundamental  o  regla  de  Barrow.  Si  /  €  C\a,  b]  y  F  es  una  primitiva  cualquiera  de 
/  en  [a,  b]  (es  decir,  F'(x)  =  f(x)),  entonces 


f(x)  dx  =  F(b)  —  F (a). 


•  Segundo  teorema  fundamental.  Si  /  £  C[a,b]  y  x  £  ( a,b ),  entonces 

^  J  f{t)dt  =  f{x). 


•  Teorema  del  valor  medio  para  integrales.  Si  /  £  C[a ,  b],  g  es  integrable  en  [a,  b\  y  g(x)  no  cambia  de 
signo  en  [a,  b],  entonces  existe  un  punto  c  en  (a,  b)  tal  que 


f{x)g{x)  dx  =  /(c)  /  #(x)  dx. 


Cuando  g(x)  =  1,  véase  la  figura  1.4  este  resultado  es  el  habitual  teorema  del  valor  medio  para  integrales  y 


proporciona  el  valor  medio  de  la  función  /  en  el  intervalo  [a,  b] ,  que  está  dado  por 


/(c) 


b  —  a 


f(x)  dx. 


V  y  =  f(x) 


Figura  1.4:  Teorema  del  valor  medio  para  integrales. 


1.2.4.  Polinomios  de  Taylor 

Terminamos  este  repaso  al  cálculo  con  los  polinomios  de  Taylor.  Siempre  nos  quedaremos  cortos  al  hacer 
hincapié  sobre  la  importancia  de  los  polinomios  de  Taylor  en  el  análisis  numérico;  en  particular,  el  siguiente 
resultado  se  usa  una  y  otra  vez. 


•  Teorema  de  Taylor.  Supongamos  que  /  £  Cn[a ,  6]  y  que  /(ra+1)  existe  en  [a,  b\.  Sea  x0  un  punto  en  [a,  b]. 
Entonces,  para  cada  x  en  [a,  6],  existe  un  punto  £(x)  entre  Xq  y  x  tal  que 

f(x)  =  Pn{x)  +  Rn(x), 


donde 


Pn(x)  —  f(x0)  +  f'(x0)h  +  2!  +  •  •  • 

=  /(TO+1)(g(x))  +1 

(n  +  1)! 


f{n)(x0)h 


f{kKx o)  ,  k 

^  k\ 


Pn  (x) 


y 


h  =  x  —  Xq. 


1.3.  UN  RECORDATORIO  DE  ÁLGEBRA  MATRICIAL 


5 


El  polinomio  Pn{x )  se  llama  n-ésimo  polinomio  de  Taylor  de  /  alrededor  de  Xq  (véase  la  figura  HÜ)  y 
Rn(x )  se  llama  error  de  truncamiento  (o  resto  de  Taylor)  asociado  a  P„(x).  Como  el  punto  £(x)  en  el 
error  de  truncamiento  Rn{x )  depende  del  punto  x  en  el  que  se  evalúa  el  polinomio  Pn(x),  podemos  verlo 
como  una  función  de  la  variable  x.  Sin  embargo,  no  debemos  confiar  en  que  seremos  capaces  de  determinar 
explícitamente  la  función  £(x);  el  Teorema  de  Taylor  simplemente  asegura  que  dicha  función  existe  y  que 
sus  valores  están  entre  i  y  i0.  De  hecho,  uno  de  los  problemas  habituales  de  los  métodos  numéricos  es  la 
determinación  de  una  cota  realista  del  valor  /*'n+1'(£(a:))  para  los  puntos  x  de  un  cierto  intervalo  dado. 

y 


V  =  f(x) 


Figura  1.5:  Gráficas  de  y  =  /(x)  (línea  continua)  y  de  su  polinomio  de  Taylor  y  =  P2(x)  alrededor  de  Xq 
(línea  discontinua). 


y  =  P2(x) 


•  La  serie  infinita  que  resulta  al  tomar  límite  en  la  expresión  de  P„(x)  cuado  n  — >  oo  se  llama  serie  de  Taylor 
de  /  alrededor  de  xq.  Cuando  Xq  =  0,  el  polinomio  de  Taylor  se  suele  denominar  polinomio  de  Maclaurin, 
y  la  serie  de  Taylor  se  llama  serie  de  Maclaurin. 


•  La  denominación  error  de  truncamiento  en  el  teorema  de  Taylor  se  refiere  al  error  que  se  comete  al  usar 
una  suma  truncada  (es  decir,  finita)  al  aproximar  la  suma  de  una  serie  infinita. 


•  Teorema  de  Taylor  en  dos  variables.  Si  f(x,  y)  y  todas  sus  derivadas  parciales  de  orden  menor  o  igual 
que  n  + 1  son  continuas  en  D  =  {(x,  y)  \  a  <  x  <  b,  c  <  y  <  d}  y  los  puntos  (x,  y)  y  (x  +  h,y  +  k)  están  ambos 
en  P,  entonces,  para  cada  x  en  [a,  b ],  existe  un  punto  £(x)  entre  x  y  x  +  h,  y,  para  cada  y  en  [c,  d],  existe  un 
punto  v{x)  entre  y  e  y  +  k,  tales  que 


f(x,  y)  =  Pn(x,y)  +  Rn(x,y), 


donde 

Pn{x,y) 


Rn(x,  y)  = 


f(x,  y)  +  y )  +  (*’  V ) 

/  h2  d2f  d2f  k2  d2f  , 

+  ,2/)  hkd¿dy{X’y)  +  W(  ’y)  1  +  ' 


1  Tí}  Aj.1\  Ora+l  f 

v-/  ^hn+í~JkJ_ - ^  .(e(x),Z/(x)). 


•  i= 0  VJ/ 


dxra_2  dyj 


E 


(n  +  1)'.  “  V  J 


dxn+1 -ódyi 


1.3.  Un  recordatorio  de  álgebra  matricial 


Las  matrices  se  utilizan  ampliamente  en  computación  debido  a  su  facilidad  y  ligereza  a  la  hora  de  mani¬ 
pular  información,  así  que  son  muy  utilizadas  en  cálculo  numérico  con  ordenador. 
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1.3.1.  Matrices 

•  Una  matriz  es  un  conjunto  bidimensional  de  escalares,  llamados  elementos,  ordenados  en  filas  y  columnas 
en  forma  de  tabla  rectangular.  Indicamos  el  tamaño  (o  dimensión)  de  la  matriz  con  el  número  de  filas  y 
columnas  que  contiene.  Una  matriz  de  m  filas  y  n  columnas,  o  matriz  (de  orden)  m  x  n,  es  un  conjunto  de 
m  •  n  elementos  a¿j,  con  i  =  1, 2, . . . ,  m  y  j  =  1, 2, . . . ,  n,  que  se  representa  de  la  siguiente  forma: 


(  a\i 

ai2 

■  ■  ■  din  \ 

a  21 

<222 

Cl2n 

\^ml 

0"m2 

& mn  ) 

Podemos  abreviar  la  representación  de  la  matriz  anterior  de  la  forma  A  =  (a¿j)  con  i  =  1,2, ...  ,m  y 
j  =  1,2,..., n. 

•  Hay  una  relación  directa  entre  matrices  y  vectores  puesto  que  podemos  pensar  una  matriz  como  una 
composición  de  vectores  filas  o  de  vectores  columnas.  Además,  un  vector  es  un  caso  especial  de  matriz:  un 
vector  fila  es  una  matriz  con  una  sola  fila  y  varias  columnas,  y  un  vector  columna  es  una  matriz  con 
varias  filas  y  una  sola  columna.  En  el  caso  m  =  n  =  1,  la  matriz  designa  simplemente  un  escalar. 

1.3.2.  Operaciones  con  matrices 

•  Si  A  =  (a¿j)  y  B  =  ( b¿j )  son  dos  matrices  que  tienen  el  mismo  orden,  m  x  n,  decimos  que  Ay  B  son  iguales 
si  Oij  =  bij  para  todo  i  =  1, 2, . . . ,  m  y  j  =  1, 2, . . . ,  n. 

•  Si  A  =  (a.¿j)  y  B  =  (bij)  son  dos  matrices  que  tienen  el  mismo  orden  m  x  n,  la  suma  de  A  y  B  es  una 

matriz  O  =  (c¿j)  del  mismo  orden  m  x  n  con  Cjj  =  +  bij  para  todo  i  =  1, 2, . . . , m  y  j  =  1,2 , ...  ,n. 

•  Si  A  =  ( a,j )  es  una  matriz  de  orden  rn  x  n,  la  multiplicación  de  A  por  un  escalar  A,  es  una  matriz 
C  =  ( Cij )  del  mismo  orden  m  x  n  con  =  A  a¿?-  para  todo  t=l,2,...,myj  =  l,2,...,n. 

•  Si  A  =  ( dij )  es  una  matriz  de  orden  m  x  n,  la  matriz  traspuesta  de  A  es  la  matriz  que  resulta  de 
intercambiar  sus  filas  por  sus  columnas,  se  denota  por  AT  y  es  de  orden  n  x  m. 

•  Si  A  =  (■ a,ij )  es  una  matriz  de  orden  m  x  p  y  B  =  ( b^ )  es  una  matriz  de  orden  p  x  n,  el  producto  de  A  por 
B  es  una  matriz  C  =  ( c¿ )  de  orden  mxn  con  =  Y^k=\  aik^kj  para  todo  i  =  1, 2, . . . ,  m  y  j  =  1,  2, . . . ,  n. 
Obsérvese  que  el  producto  de  dos  matrices  solo  está  definido  si  el  número  de  columnas  de  la  primera  matriz 
coincide  con  el  número  de  filas  de  la  segunda. 

1.3.3.  Matrices  especiales 

•  Decimos  que  una  matriz  A  =  ( a,y )  es  cuadrada  si  tiene  el  mismo  número  de  filas  que  de  columnas,  y  de 
orden  n  si  tiene  n  filas  y  n  columnas.  Se  llama  diagonal  principal  al  conjunto  de  elementos  an,a 22,  ■  ■  ■ ,  cLnn- 

•  Llamamos  matriz  diagonal  a  una  matriz  cuadrada  que  tiene  algún  elemento  distinto  de  cero  en  la  diagonal 
principal  y  ceros  en  el  resto  de  elementos. 

•  Una  matriz  cuadrada  con  ceros  en  todos  los  elementos  por  encima  (debajo)  de  la  diagonal  principal  se  llama 
matriz  triangular  inferior  (superior). 

•  Una  matriz  diagonal  con  todo  unos  en  la  diagonal  principal  se  denomina  matriz  identidad  y  se  denota  por 
I.  Es  por  definición  la  única  matriz  cuadrada  tal  que  AI  =  IA  =  A  para  cualquier  matriz  cuadrada  A. 

•  Una  matriz  simétrica  es  una  matriz  cuadrada  A  tal  que  A  =  AT . 


•  La  matriz  cero  es  una  matriz  con  todos  sus  elementos  iguales  a  cero. 
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1.3.4.  Inversa  de  una  matriz 

•  Decimos  que  una  matriz  cuadrada  A  es  invertible  (o  regular  o  no  singular )  si  existe  una  matriz  cuadrada  B 
tal  que  AB  =  BA  =  I.  Se  dice  entonces  que  B  es  la  matriz  inversa  de  A  y  se  denota  por  A-1.  (Una  matriz 
que  no  es  invertible  se  dice  singular .) 


•  Si  una  matriz  A  es  invertible,  su  inversa  también  lo  es  y  (A  x)  1  =  A. 

•  Si  A  y  B  son  dos  matrices  invertibles,  su  producto  también  lo  es  y  ( AB )_1  =  B~1A~1. 

1.3.5.  Determinante  de  una  matriz 

•  El  determinante  de  una  matriz  solo  está  definido  para  matrices  cuadradas  y  su  valor  es  un  escalar.  El 
determinante  de  una  matriz  A  cuadrada  de  orden  n  se  denota  por  |A|  o  clet(A)  y  se  define  como 

det(A)  —  ^  ^ (  1)  * ' '  n njni 

j 

donde  la  suma  se  toma  para  todas  las  n!  permutaciones  de  grado  n  y  k  es  el  número  de  intercambios  necesarios 
para  poner  el  segundo  subíndice  en  el  orden  1,2 , ,n. 

•  Algunas  propiedades  de  los  determinantes  son: 

a.  det(A)  =  det(AT). 

b.  clet(AB)  =  det(A)  det(B). 

c.  det(A_1)  = 

el.  Si  dos  filas  o  dos  columnas  de  una  matriz  coinciden,  el  determinante  de  esta  matriz  es  cero. 

e.  Cuando  se  intercambian  dos  filas  o  dos  columnas  de  una  matriz,  su  determinante  cambia  de  signo. 

f.  El  determinante  de  una  matriz  diagonal  es  el  producto  de  los  elementos  de  la  diagonal. 

•  Si  denotamos  por  A¿j  la  matriz  de  orden  (n  —  1)  que  se  obtiene  de  eliminar  la  fila  i  y  la  columna  j  de  la 
matriz  A,  llamamos  menor  complementario  asociado  al  elemento  de  la  matriz  A  al  det  (A¿j). 

•  Se  llama  fc-ésimo  menor  principal  de  la  matriz  A  al  determinante  de  la  submatriz  principal  de  orden  k. 

•  Definimos  el  cofactor  del  elemento  a¿j  de  la  matriz  A  por  A ¿j  =  (— 1)Í+J'  det(A¿:í). 

•  Si  A  es  una  matriz  invertible  de  orden  n,  entonces  A-1  =  det^  C,  donde  C  es  la  matriz  de  elementos 

A ij,  para  todo  i,j  =  1,2,  Obsérvese  entonces  que  una  matriz  cuadrada  es  invertible  si  y  solo  si  su 

determinante  es  distinto  de  cero. 

1.3.6.  Valores  propios  y  vectores  propios 

•  Si  A  es  una  matriz  cuadrada  de  orden  n,  un  número  A  es  un  valor  propio  de  A  si  existe  un  vector  no  nulo 
v  tal  que  Av  =  Av.  Al  vector  v  se  le  llama  vector  propio  asociado  al  valor  propio  A. 

•  El  valor  propio  A  es  solución  de  la  ecuación  característica  det(A  —  XI)  =  0,  donde  det(A  —  XI)  se  llama 
polinomio  característico.  Este  polinomio  es  de  grado  n  en  A  y  tiene  n  valores  propios  (no  necesariamente 
distintos). 
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1.3.7.  Normas  vectoriales  y  normas  matriciales 

•  Para  medir  la  «longitud»  de  los  vectores  y  el  «tamaño»  de  las  matrices  se  suele  utilizar  el  concepto  de 
norma,  que  es  una  función  que  toma  valores  reales.  Un  ejemplo  simple  en  el  espacio  euclidiano  tridimensinal  es 
un  vector  v  =  (tq,  v2,  U3),  donde  iq,  v2  y  v3  son  las  distancias  a  lo  largo  de  los  ejes  x,  y  y  z,  respectivamente. 
La  longitud  del  vector  v  (es  decir,  la  distancia  del  punto  (0,0,0)  al  punto  (i>i,v2,v3))  se  calcula  como 
|| v||e  =  \/v\  +  v\  +  uf,  donde  la  notación  ||v||e  indica  que  esta  longitud  se  refiere  a  la  norma  euclidiana  del 
vector  v.  De  forma  similar,  para  un  vector  v  de  dimensión  n,  v  =  (v\,v2,  ■  ■  ■  ,vn),  la  norma  euclidiana  se 
calcula  como  ||v||e  =  \Jv\  +  v\  +  ■  ■  ■  +  v\.  Este  concepto  puede  extenderse  a  una  matriz  m  x  n,  A  =  ( a¿j ), 

de  la  siguiente  manera  ||A||e  =  au>  due  recibe  el  nombre  de  norma  de  Frobenius. 

•  Hay  otras  alternativas  a  las  normas  euclidiana  y  de  Frobenius.  Dos  normas  usuales  son  la  norma  1  y  la 
norma  infinito: 

a.  La  norma  1  de  un  vector  v  =  (tq,  v2,  ■  ■  ■ ,  vn)  se  define  como  ||v||i  =  ]U"=1  |v¿|.  De  forma  similar,  la 
norma  1  de  una  matriz  m  x  n,  A  =  (a¿j),  se  define  como  IIH))!  =  máx!<j<n  Xuli  \aij\- 

b.  La  norma  infinito  de  un  vector  v  =  (tq,  v2,  •  ■  • ,  vn)  se  define  como  HvHoo  =  máx¿<i<„  |tq|.  Similarmente, 
la  norma  infinito  de  una  matriz  m  x  n,  A  =  (a¿,,-),  se  define  como  HÁH^  =  máx^^  Y^j=i  \aij\- 

•  Recordemos,  por  la  teoría  del  álgebra  lineal,  que  todas  las  normas  son  equivalentes  en  un  espacio  vectorial 
de  dimensión  finita.  Por  ejemplo,  si  dos  vectores  están  próximos  según  la  norma  ||  •  ||i,  también  lo  están  según 
la  norma  ||  •  ||e,  y  recíprocamente. 

•  Aunque  puede  haber  ciertas  ventajas  teóricas  para  la  utilización  de  algunas  normas,  la  elección  de  una  norma 
suele  estar  influenciada  por  las  consideraciones  prácticas.  Por  ejemplo,  la  norma  infinita  es  muy  utilizada  por 
la  facilidad  con  que  se  calcula  y  por  el  hecho  de  que  habitualmente  proporciona  una  medida  adecuada  del 
tamaño  de  una  matriz. 


1.4.  Algunas  ideas  básicas  sobre  el  cálculo  con  ordenador 

La  utilización  de  ordenadores  ha  cambiado  la  forma  de  resolver  problemas  numéricamente.  A  la  hora  de 
hacer  cálculos  con  lápiz  y  papel  solemos  utilizar  aritmética  racional,  mientras  que  si  esos  mismos  cálculos 
los  hacemos  con  el  ordenador,  en  la  mayoría  de  los  casos,  podemos  utilizar  aritmética  finita  y  guardar  los 
valores  obtenidos  en  la  memoria  del  ordenador,  lo  que  habitualmente  conlleva  una  pérdida  de  exactitud.  Por 
lo  tanto,  al  realizar  cálculos  con  el  ordenador  se  cometen  errores  y  el  análisis  de  estos  errores  es  importante. 

En  esta  sección  se  describen  aspectos  básicos  relacionados  con  la  identificación,  cuantificación  y  minimi- 
zación  de  errores.  Destacaremos  que  dos  son  los  errores  numéricos  más  comunes:  los  errores  de  redondeo  y  los 
errores  de  trucamiento.  Los  primeros  son  como  consecuencia  de  que  los  ordenadores  solo  pueden  representar 
cantidades  con  un  número  finito  de  dígitos.  Los  segundos  vienen  como  consecuencia  de  la  diferencia  entre 
una  formulación  matemática  y  su  aproximación  obtenida  mediante  un  método  numérico. 

Como  es  normal  que  los  errores  se  propaguen  a  lo  largo  de  una  sucesión  de  operaciones,  habrá  que  prestar 
especial  atención  al  fenómeno  de  la  propagación  de  los  errores,  destacando  los  métodos  que  proporcionen 
resultados  fiables.  Además,  como  bastantes  métodos  numéricos  están  definidos  mediante  técnicas  iterativas 
que  involucran  sucesiones  numéricas,  daremos  una  definición  para  describir  la  rapidez  de  su  convergencia, 
estando  en  general  interesados  en  que  ésta  sea  lo  más  rápida  posible.  Terminaremos  hablando  del  coste 
computacional  de  los  métodos  numéricos. 

1.4.1.  Fuentes  de  error 

Comenzamos  repasando  algunos  conceptos  básicos  referentes  a  la  representación  aproximada  de  los  núme¬ 
ros.  A  la  hora  de  realizar  un  cálculo  es  importante  asegurarse  de  que  los  números  que  intervienen  en  el  cálculo 
se  pueden  utilizar  con  confianza.  Para  ello,  se  introduce  el  concepto  de  cifras  significativas,  que  designan 
formalmente  la  confianza  de  un  valor  numérico,  y  que  son  aquellas  que  pueden  utilizarse  con  confianza. 

Otros  conceptos  a  los  que  también  hay  que  prestar  cierta  atención  son  la  exactitud  y  la  precisión.  La 
exactitud  mide  la  cercanía  entre  los  valores  calculados  y  los  valores  exactos,  mientras  que  la  precisión  se 
refiere  a  la  cercanía  entre  distintos  valores  calculados. 
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Definiciones  de  error 

•  A  la  hora  de  representar  cantidades  y  cálculos  matemáticos  exactos  mediante  aproximaciones  aparecen 
errores  numéricos,  que  incluyen  los  errores  de  redondeo  que  se  producen  cuando  se  representan  números 
exactos  mediante  números  con  límite  de  cifras  significativas,  y  los  errores  de  truncamiento,  que  se  produden 
al  emplear  aproximaciones  como  procedimientos  matemáticos  exactos.  En  ambos  casos  el  error  numérico 
viene  dado  por  la  diferencia  entre  el  valor  exacto  y  su  valor  aproximado,  lo  que  se  denomina  error  absoluto. 
Esto  es,  si  x  es  el  valor  aproximado  y  a:  el  valor  exacto  (habitualmente  desconocido),  el  error  cometido  a  la 
hora  de  utilizar  el  valor  aproximado  es:  Error  absoluto  (x)  =  x  —  x.  En  la  mayoría  de  las  aplicaciones  el  signo 
del  error  absoluto  es  de  poca  importancia,  así  que  habitualmente  se  considera  el  error  absoluto  sin  signo: 
Error  absoluto  (x)  =  \x  —  x\. 

Sin  embargo,  para  problemas  en  los  que  la  magnitud  del  valor  real  puede  ser  particularmente  muy  grande 
(o  muy  pequeña),  el  error  relativo  puede  ser  más  importante  que  el  error  absoluto  ( Error  relativo (x)  = 
\x  —  í|/|x|).  Cuando  queremos  calcular  el  error  relativo,  a  menudo  se  utiliza  el  valor  aproximado  x  en  el 
denominador  en  vez  del  valor  exacto  desconocido  x. 

En  la  práctica  es  imposible  conocer  exactamente  el  valor  del  error  correspondiente  a  una  aproximación, 
de  manera  que  deberemos  contentarnos  con  acotarlo  o  estimarlo  (sin  conocerlo).  Muchos  métodos  numéricos 
proporcionan  una  estimación  del  error,  además  de  la  aproximación,  esperando  que  dicha  estimación  coincida 
aproximadamente  con  el  error. 


•  En  general,  es  obvio  que  los  programas  de  ordenador  solo  pueden  guardar  un  número  finito  de  cifras 
significativas,  de  manera  que  cantidades  específicas  como  2/3,  \/3,  e  o  n  no  se  pueden  representar  con 
exactitud  con  un  ordenador,  puesto  que  tienen  infinitos  decimales.  Existen  dos  posibilidades.  La  más  simple 
es  truncar  el  número,  descartando  todas  las  cifras  que  estén  detrás  de  las  que  que  el  ordenador  puede  guardar. 
La  otra  es  redondear  el  número,  el  resultado  depende  entonces  del  valor  de  la  primera  cifra  a  descartar.  Si 
el  ordenador  permite  hasta  n  cifras,  el  redondeo  produce  el  mismo  resultado  que  el  truncamiento  si  la  cifra 
(n  +  l)-ésima  es  0,  1,  2,  3  o  4,  mientras  que  si  la  cifra  (n+  l)-ésima  es  5,  6,  7,  8  o  9,  entonces  la  cifra  n-ésima 
se  incremente  en  1.  Cuando  se  omiten  cifras  significativas  hablaremos  de  error  de  redondeo. 

Los  errores  que  se  cometen  con  el  redondeo  tienen  menor  probabilidad  de  acumularse  durante  la  repetición 
de  cálculos,  puesto  que  el  valor  exacto  es  más  grande  que  el  valor  redondeado  aproximadamente  la  mitad  de 
las  veces  y  más  pequeño  aproximadamente  la  otra  mitad.  Además,  el  error  absoluto  más  grande  que  puede 
ocurrir  es  unas  dos  veces  más  grande  tanto  a  la  hora  de  truncar  como  a  la  hora  de  redondear.  Por  otra  parte, 
truncar  no  requiere  decidir  si  hay  que  cambiar  la  última  cifra  guardada. 

Los  errores  de  redondeo  se  producen  frecuentemente  cuando  los  números  que  están  implicados  en  los 
cálculos  difieren  significativamente  en  su  magnitud  y  cuando  se  restan  dos  números  que  son  casi  idénticos. 


•  Los  errores  de  truncamiento  se  producen  cuando  utilizamos  una  aproximación  en  lugar  de  un  procedi¬ 
miento  matemático  exacto.  Para  conocer  las  características  de  estos  errores  se  suelen  considerar  los  polinomios 
de  Taylor,  que  se  utilizan  ampliamente  en  los  métodos  numéricos  para  expresar  funciones  de  manera  aproxi¬ 
mada.  Una  gran  cantidad  de  métodos  numéricos  están  basados  en  la  utilización  de  unos  pocos  términos  de 
los  polinomios  de  Taylor  para  aproximar  una  función. 

Cuando  se  aproxima  un  proceso  continuo  por  uno  discreto,  para  errores  provocados  por  un  tamaño  de 
paso  finito  h,  resulta  a  menudo  útil  describir  la  dependencia  del  error  de  h  cuando  h  tiende  a  cero. 


Decimos  que  una  función  f(h)  es  una  «O  grande»  de  hn  si  |/(/i)|  <  c\hn\  para  alguna  constante 
c,  cuando  h  es  próximo  a  cero;  se  escribe  f(h)  =  0{hn). 


Si  un  método  tiene  un  término  de  error  que  es  0(hn ),  se  suele  decir  que  es  un  método  de  orden  n.  Por 
ejemplo,  si  utilizamos  un  polinomio  de  Taylor  para  aproximar  la  función  g  en  x  =  a  +  h,  tenemos 


g(x)  =  g(a  +  h)  =  g(a )  +  hg'(a)  + 


ú3 

3! 


para  algún  £  £  [a,a  +  h]. 


Suponiendo  que  g  es  suficientemente  clerivable,  la  aproximación  anterior  es  0(h3),  puesto  que  el  error, 
§rS,///( 0,  satisface 


ú3 

3Í 


g"'(  0 


< 


M 

3!~ 


h3 
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donde  M  es  el  máximo  de  g"'{x)  para  x  £  [a,a  +  h). 

El  error  de  truncamiento  depende  del  método  numérico  utilizado  para  resolver  un  problema,  es  indepen¬ 
diente  del  error  de  redondeo  y  se  produce  incluso  cuando  las  operaciones  matemáticas  son  exactas. 

•  La  suma  de  los  errores  de  redondeo  y  de  truncamiento  es  lo  que  habitualmente  llamamos  error  numérico 
total  (también  llamado  error  verdadero),  que  está  incluido  en  la  solución  numérica.  En  general,  si  se  incre¬ 
menta  el  número  de  cifras  significativas  en  el  ordenador,  se  minimizan  los  errores  de  redondeo,  y  los  errores  de 
truncamiento  disminuyen  a  medida  que  los  errores  de  redondeo  se  incrementan.  Por  lo  tanto,  para  disminuir 
uno  de  los  dos  sumandos  del  error  total  debemos  incrementar  el  otro.  El  reto  consiste  en  identificar  dónde 
los  errores  de  redondeo  no  muestren  los  beneficios  de  la  reducción  del  error  de  truncamiento  y  determinar 
el  tamaño  del  incremento  apropiado  para  un  cálculo  en  particular.  Estas  situaciones  son  poco  comunes  en 
casos  reales  porque  habitualmente  los  ordenadores  utilizan  suficientes  cifras  significativas  como  para  que  los 
errores  de  redondeo  no  predominen. 

Como  el  error  total  no  se  puede  calcular  en  la  mayoría  de  los  casos,  se  suelen  utilizar  otras  medidas  para 
estimar  la  exactitud  de  un  método  numérico,  que  suelen  depender  del  método  específico.  En  algunos  métodos 
el  error  numérico  se  puede  acotar,  mientras  que  en  otros  se  determina  una  estimación  del  orden  de  magnitud 
del  error. 

•  Terminamos  recordando  que  cuando  buscamos  las  soluciones  numéricas  de  un  problema  real  los  resultados 
que  obtenemos  generalmente  no  son  exactos.  Una  fuente  habitual  de  inexactitudes  radica  en  la  simplificación 
del  modelo  del  problema  original.  También  suelen  aparecer  errores  a  la  hora  de  interpretar  una  colección  de 
datos.  Además,  habrá  que  estar  atentos  a  los  errores  que  no  están  relacionados  directamente  con  los  métodos 
numéricos  aplicados,  como  por  ejemplo,  entre  otros,  equivocaciones,  errores  de  formulación  o  del  modelo,  e 
incertidumbre  en  la  obtención  de  datos. 

1.4.2.  Representación  de  los  números  reales  en  el  ordenador 

La  utilización  de  ordenadores  hoy  en  día  juega  un  papel  fundamental  en  el  desarrollo  de  los  métodos 
numéricos,  ya  que  nos  permiten  resolver  problemas  que  no  seríamos  capaces  de  hacerlo  sin  ellos.  Sin  embargo, 
aunque  los  ordenadores  están  programados  para  que  se  puedan  utilizar  con  una  gran  exactitud,  hay  que  tener 
en  cuenta  algunas  consecuencias  de  cómo  realizan  los  cálculos,  como  consecuencia  de  que  pueden  conducir  a 
efectos  inesperados  en  los  resultados. 

Toda  operación  que  realiza  un  ordenador  («operación  máquina»)  está  sujeta  a  errores  de  redondeo,  que 
aparecen  como  consecuencia  de  que  en  un  ordenador  no  se  puede  representar  más  que  un  subconjunto  finito 
del  conjunto  de  los  números  reales. 

Mientras  que  el  conjunto  de  los  números  reales  R  es  conocido,  la  manera  en  la  que  los  ordenadores 
los  tratan  es  menos  conocida.  Por  una  parte,  como  los  ordenadores  tienen  recursos  limitados,  sólo  se  puede 
representar  un  subconjunto  de  R  de  dimensión  finita.  Denotamos,  tal  y  como  se  hace  en  m,  este  subconjunto 
por  F,  que  está  formado  por  números  que  se  llaman  números  de  punto  flotante.  Por  otra  parte,  como  veremos 
posteriormente,  F  está  caracterizado  por  propiedades  diferentes  de  las  de  R.  La  razón  es  que  cualquier  número 
real  x  es  truncado  en  principio  por  el  ordenador,  dando  origen  a  un  nuevo  número,  llamado  número  de  punto 
flotante,  que  denotamos  por  fl(x)  y  que  no  coincide  necesariamente  con  el  número  original  x. 

A  finales  de  los  años  1950  se  estandarizó  el  uso  de  números  de  punto  flotante  para  los  ordenadores,  aunque 
ciertas  especificaciones  todavía  podían  variar  de  un  ordenador  a  otro,  hasta  que  el  Instituto  de  Ingenieros 
Electrónicos  y  Eléctricos  (IEEE,  en  sus  siglas  en  inglés)  desarrolló  el  estándar  IEEE  en  1985,  que  fue  aprobado 
en  1989  por  la  Comisión  Internacional  Electrónica  (IEC,  en  sus  siglas  en  inglés)  como  estándar  internacional 
IEC559.  La  idea  básica  de  la  aritmética  de  punto  flotante  es  esencialmente  la  misma  que  para  la  notación 
científica,  excepto  que  para  un  ordenador  la  base  es  casi  siempre  2  en  vez  de  10. 

Representación  en  punto  flotante 

Un  ordenador  almacena,  en  general,  un  número  real  x  de  la  siguiente  forma  (E33): 

x  =  (-l)s  •  (0.O1O2  ...at)-pe  =  (-l)s  •  m  •  /3e_t,  ai  /  0,  (1.1) 

donde  s  es  0  o  1,  ¡3  (un  entero  positivo  mayor  o  igual  que  2)  es  la  base  adoptada  por  el  ordenador  específico 
que  estemos  manejando,  m  es  un  entero  llamado  mantisa  cuya  longitud  t  es  el  máximo  número  de  cifras  a¿ 
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(con  0  <  a¿  <  (3  —  1)  que  se  almacenan,  y  e  es  un  número  entero  llamado  exponente.  Los  números  de  la  forma 
(|1.1|)  se  llaman  números  de  punto  flotante,  porque  la  posición  de  su  punto  decimal  no  es  fija.  A  las  cifras 
0102  . . .  ap  (con  p  <  t)  se  les  suele  llamar  p  primeras  cifras  significativas  de  x. 

La  condición  ai  ^  0  asegura  que  un  número  no  puede  tener  múltiples  representaciones.  Por  ejemplo,  sin 
esta  restricción  el  número  1/10  podría  ser  representado  (en  la  base  decimal)  como  0.1  •  10°,  pero  también 
como  0.01  ■  101,  etc. 

Por  tanto,  el  conjunto  F  está  totalmente  caracterizado  por  la  base  /3,  el  número  de  cifras  significativas  t 
y  el  rango  (L,  U )  (con  L  <  0  y  U  >  0)  de  variación  del  índice  e.  Por  esto  se  denota  como  F(/3,t,  L ,  U). 

El  número  0  no  pertenece  a  F,  pues  en  tal  caso  tendríamos  ai  =  0  en  por  tanto  se  maneja  se¬ 

paradamente.  Además,  como  L  y  U  son  finitos,  no  se  pueden  representar  números  cuyo  valor  absoluto  sea 
arbitrariamente  grande  o  arbitrariamente  pequeño.  Siendo  más  concretos,  el  número  real  positivo  más  pe¬ 
queño  y  el  más  grande  de  F  vienen  dados  respectivamente  por 

Xmin^pb-1  y  Xmax  =  ¡3°  {l  -  /3_‘). 

Es  inmediato  verificar  que  si  x  £  F(/3,t,  L,  U),  entonces  —x  £  F(/3,  t,  L,  U),  de  manera  que  xmi„  <  M  < 
Xmax-  Por  lo  tanto,  solo  podemos  representar  con  el  ordenador  un  número  máximo  en  valor  absoluto  de 
números  reales,  de  manera  que  cuando  intentamos  utilizar  un  número  de  valor  absoluto  mayor  que  el  máximo 
representable,  se  produce  un  error  llamado  overflow  (desbordameniento  por  exceso).  También  puede  ocurrir 
lo  contrario,  cuando  utilizamos  un  número  no  nulo  pero  menor  en  valor  absoluto,  produciéndose  entonces  un 
error  llamado  underflow  (desbordameniento  por  defecto). 

Nota.  m)  Si  bien  es  cierto  que  los  errores  de  redondeo  son  normalmente  pequeños,  cuando  se  repiten 
dentro  de  largos  y  complejos  algoritmos,  pueden  dar  origen  a  efectos  catastróficos.  Dos  casos  destacados 
conciernen  a  la  explosión  del  cohete  Arianne  el  4  de  junio  de  1996,  generada  por  un  overflow  en  el  ordenador 
de  a  bordo,  y  al  fracaso  de  la  misión  de  un  misil  americano  patriot  durante  la  guerra  del  Golfo  en  1991,  a 
causa  de  un  error  de  redondeo  en  el  cálculo  de  su  trayectoria. 


Épsilon  de  la  máquina 


Además  de  la  importancia  de  la  representación  de  los  números  reales  en  el  ordenador,  también  es  impor¬ 
tante  la  exactitud  con  que  se  realizan  los  cálculos  con  los  números  reales.  Para  esto  habrá  que  tener  en  cuenta 
el  mayor  valor  positivo  cm  tal  que  1  +  x  =  1,  para  todo  x  £  (0 ,£m),  que  proporciona  la  distancia  entre  1 
y  el  número  en  punto  flotante  mayor  que  1  más  cercano  a  éste  que  se  puede  representar  con  el  ordenador. 
Este  número  cm  se  llama  épsilon  de  la  máquina  y  caracteriza  la  precisión  de  la  aritmética  en  punto  flotante, 
dependiendo  del  ordenador  y  del  tipo  de  variable.  Para  el  estándar  IEC559,  cm  =  /31_í-  En  general,  el  valor 
ém  depende  del  tipo  de  redondeo  que  utilice  el  sistema. 

Por  otra  parte,  notemos  que  el  error  de  redondeo  que  se  genera  inevitablemente  siempre  que  un  número 
real  x  ^  0  se  reemplaza  por  su  represetante  fl{x)  en  F,  es  afortunadamente  pequeño,  puesto  que 


x  -  fl{x) 


1 

-2£M‘ 


(1.2) 


Señalamos  que  en  ( 1.2 1  estimamos  el  error  relativo  sobre  x,  que  es  indudablemente  más  significativo  que  el 


error  absoluto  |a:  —  fl{x)\.  En  realidad,  este  último  no  tiene  en  cuenta  el  orden  de  magnitud  de  x  mientras 
que  el  primero  si. 


Sobre  las  operaciones  en  punto  flotante 

Puesto  que  F  es  un  subconjunto  de  R,  las  operaciones  algebraicas  elementales  sobre  números  de  punto  flo¬ 
tante  no  gozan  de  todas  las  propiedades  de  las  operaciones  análogas  en  R.  Concretamente,  la  conmutatividad 
para  la  suma  se  verifica  (esto  es  fl(x  +  y)  =  fl(y  +  .t)),  así  como  para  la  multiplicación  ( fl(xy )  =  fl(yx)), 
pero  se  violan  otras  propiedades  como  la  asociativa  y  la  distributiva.  Además,  el  0  ya  no  es  único.  Véase  |22j 
para  mayor  detalle. 

El  estándar  IEC559  tiene  en  cuenta  dos  circunstancias  excepcionales:  el  resultado  de  dividir  un  número 
finito  por  cero,  que  se  denota  por  Inf ,  y  el  resultado  de  una  operación  indeterminada,  como  por  ejemplo  0/0 
o  oo/oo,  que  produce  lo  que  se  llama  un  «no-número»,  denotado  por  NaN  (del  inglés  Not  a  Number ),  al  que 
no  se  aplican  las  reglas  normales  de  cálculo  (la  presencia  de  un  NaN  en  una  sucesión  de  operaciones  implica 
que  automáticamente  el  resultado  es  un  NaN).  El  tratamiento  de  ambos  depende  del  entorno  computacional, 
debiéndose  evitar  siempre  que  se  pueda. 
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Almacenamiento  de  un  número  en  la  memoria  del  ordendor 

Los  ordenadores  guardan  y  procesan  los  números  en  forma  binaria  (base  2).  Cada  dígito  binario  (0  o  1) 
se  llama  bit  (por  dígito  binario).  La  memoria  de  los  ordenadores  está  organizada  en  bytes,  siendo  un  byte 
ocho  bits.  Según  el  estándar  IEC559,  los  ordenadores  guardan  los  números  y  realizan  los  cálculos  en  precisión 
simple  o  en  doble  precisión.  Esto  es  que  los  números  se  guardan  en  cadenas  de  32  bits  en  precisión  simple 
y  de  64  bits  en  doble  precisión.  En  ambos  casos  el  primer  bit  es  para  el  signo  del  número,  los  siguientes  8 
bits  en  precisión  simple  (11  bits  en  doble  precisión)  son  para  guardar  el  exponente  y  los  siguientes  23  bits  en 
precisión  simple  (52  bits  en  doble  precisión)  son  para  guardar  la  mantisa. 

La  precisión  se  refiere  aquí  al  número  de  cifras  significativas  de  un  número  real  que  se  puede  guardar 
en  un  ordenador.  Por  ejemplo,  el  número  1/9  =  0.1111...  solo  se  puede  representar  en  un  ordenador  de 
forma  truncada  o  redondeada  con  un  número  finito  de  dígitos  binarios,  ya  que  la  cantidad  de  memoria  donde 
se  guardan  estos  bits  es  finita.  Cuantas  más  cifras  a  la  derecha  del  punto  decimal  se  puedan  guardar,  más 
precisa  es  la  representación  del  número  en  el  ordenador.  Notemos  que  la  precisión  en  un  número  real  en  doble 
precisión  no  se  dobla  si  comparamos  con  el  número  en  precisión  simple,  sino  que  se  refiere  a  que  la  doble 
precisión  utiliza  el  doble  de  dígitos  binarios  para  representar  el  número  real  que  la  precisión  simple. 

La  doble  precisión  tiene  la  ventaja  de  poder  representar  más  números  de  manera  más  exacta,  mientras 
que  la  precisión  simple  tiene  la  ventaja  de  que  requiere  menos  espacio,  lo  que  puede  ser  importante  cuando 
se  guardan  grandes  cantidades  de  datos.  En  la  práctica,  como  las  velocidades  de  los  ordenadores  de  hoy  en 
día  son  más  o  menos  las  mismas  para  los  dos  formatos,  se  suele  utilizar  más  la  doble  precisión. 

En  el  estándar  IEC559  para  la  aritmética  binaria  de  punto  flotante  tenemos  F  =  F(2,  24,  —125, 128)  para 
la  precisión  simple  y  F  =  F(2, 53, —1024, 1024)  para  la  doble  precisión.  Notemos  que,  en  doble  precisión,  53 
cifras  significativas  en  base  2  corresponden  a  15  cifras  significativas  en  base  10. 

A  modo  de  resumen,  podemos  decir  que  la  precisión  del  ordenador  es  la  que  dicta  la  exactitud  de  los 
resultados. 

1.4.3.  Estabilidad  y  convergencia 

En  realidad  podemos  decir  que  el  error  es  inevitable  en  el  cálculo  numérico.  Como  acabamos  de  ver,  el 
simple  hecho  de  utilizar  un  ordenador  para  representar  los  números  reales  introduce  errores.  Por  tanto,  en 
parte,  lo  importante  no  es  esforzarse  por  eliminar  los  errores,  sino  más  bien  ser  capaces  de  controlar  sus 
efectos. 

Las  pérdidas  de  exactitud  debidas  a  los  errores  de  redondeo  se  pueden  evitar  a  menudo  eligiendo  con 
cuidado  el  orden  en  el  que  se  realizan  las  operaciones  o  reformulando  el  problema. 

A  lo  largo  de  este  texto  consideraremos  varios  problemas  de  aproximación  y  se  necesitará,  en  cada  caso, 
desarrollar  métodos  de  aproximación  que  produzcan  resultados  precisos  para  una  amplia  variedad  de  proble¬ 
mas.  Como  los  métodos  de  aproximación  no  se  construyen  de  la  misma  forma,  hace  falta  disponer  de  una  serie 
de  condiciones  que  nos  permitan  categorizar  su  precisión  (aunque  puede  ser  que  no  todas  estas  condiciones 
sean  aplicables  en  cada  problema  particular). 

Una  condición  que  hay  que  imponer  siempre  que  sea  posible  es  la  de  estabilidad.  Se  dice  que  un  método  es 
estable  si  pequeñas  variaciones  en  los  datos  iniciales  producen  pequeñas  variaciones  en  los  resultados  finales 
correspondientes.  Cuando  pequeñas  variaciones  en  los  datos  iniciales  producen  variaciones  grandes  en  los 
resultados  finales  el  método  es  inestable.  Algunos  métodos  son  estables  sólo  para  algunos  datos  iniciales,  se 
dice  entonces  que  estos  métodos  son  condicionalmente  inestables.  Es  importante  caracterizar  las  propiedades 
de  estabilidad  siempre  que  se  pueda. 

La  forma  en  que  los  errores  de  redondeo  crecen  conforme  se  va  aplicando  un  método  es  uno  de  los  aspectos 
más  importantes  en  relación  con  la  estabilidad.  Un  método  es  estable  si  presenta  crecimiento  lineal  del  error 
(esto  es,  si  existe  una  constante  C  independiente  de  n  tal  que  En  ss  CuEq,  donde  Eq  >  0  denota  un  error 
inicial  y  En  representa  la  magnitud  del  error  después  de  n  operaciones  posteriores),  mientras  que  es  inestable 
si  el  crecimiento  del  error  es  exponencial  (es  decir,  si  existe  una  constante  C  >  1  independiente  de  n  tal  que 
En  «  CnE0). 

Por  otra  parte,  como  a  menudo  se  utilizan  técnicas  que  construyen  una  sucesión  de  aproximaciones,  lo 
que  generalmente  interesa  es  disponer  de  técnicas  cuyas  sucesiones  converjan  lo  más  rápidamente  posible. 
Mediante  la  siguiente  definición  podremos  comparar  las  velocidades  de  convergencia  de  los  distintos  métodos. 

Supongamos  que  { an }))U1  es  una  sucesión  que  converge  a  un  número  a  cuando  n  — >  oo.  Si  existen 
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dos  constantes  positivas  p  y  K  tales  que 

la  —  an\  <  K/np ,  para  n  suficientemente  grande, 

entonces  se  dice  que  {an}  converge  a  a  con  orden,  o  velocidad,  de  convergencia  0(1 /np). 

Lo  anterior  se  indica  escribiendo  an  =  a  +  0(1 /np)  y  diciendo  que  «an  — >  a  con  orden  de  convergencia 
l/np».  En  general  lo  que  interesa  es  buscar  el  mayor  valor  de  p  para  el  cual  an  =  a  +  0(l/np). 

1.4.4.  Coste  computacional  y  eficiencia 

Normalmente  resolvemos  un  problema  en  el  ordenador  mediante  un  algoritmo,  que  es  una  directiva  precisa 
en  forma  de  texto  finito,  que  especifica  la  ejecución  de  una  serie  finita  de  operaciones  elementales.  Estamos 
interesados  en  aquellos  algoritmos  que  involucran  sólo  un  número  finito  de  etapas. 

El  coste  computacional  de  un  algoritmo  es  el  número  de  operaciones  de  punto  flotante  que  requiere  su 
ejecución.  A  menudo  la  velocidad  de  un  ordenador  se  mide  por  el  máximo  número  de  operaciones  en  punto 
flotante  que  puede  efectuar  en  un  segundo  (flops,  del  inglés  floating  operation). 

En  general,  véase  |¡2'5| ,  el  conocimiento  exacto  del  número  de  operaciones  requerido  por  un  algoritmo  dado 
no  es  esencial.  En  cambio  es  útil  determinar  su  orden  de  magnitud  como  función  de  un  parámetro  5  que  está 
relacionado  con  la  dimensión  del  problema.  Por  tanto,  decimos  que  un  algoritmo  tiene  complejidad  constante  si 
requiere  un  número  de  operaciones  independiente  de  5,  es  decir  0(1)  operaciones,  complejidad  lineal  si  requiere 
0(6)  operaciones,  o,  con  mayor  generalidad,  complejidad  polinómica  si  requiere  0(6n )  operaciones,  para  un 
entero  positvo  n.  Otros  algoritmos  pueden  tener  complejidad  exponencial ,  0(ks)  operaciones  (k  constante), 
o  incluso  complejidad  factorial ,  0(6\)  operaciones.  Aquí  el  símbolo  0(6nj  significa  que  «se  comporta,  para  6 
grande,  como  una  constante  multiplicada  por  Sn». 

Como  habitualmente  un  problema  se  puede  resolver  mediante  diversos  algoritmos,  habrá  que  decidirse  por 
uno.  Un  criterio  útil  podría  ser  el  de  elegir  aquél  que  proporcione  menores  errores,  pero  hay  uno  mejor  (véase 
|27j ) ,  aquél  que  necesite  menor  trabajo  proporcionando  errores  dentro  de  unos  límites  predeterminados.  Esto 
es  lo  que  se  conoce  como  eficiencia  de  un  algoritmo,  y  depende  tanto  del  tamaño  de  los  errores  como  del 
coste  computacional  del  algoritmo. 

Terminamos  diciendo  que  otro  factor  significativo  a  la  hora  de  analizar  los  algoritmos  suele  ser  el  tiem¬ 
po  necesario  para  acceder  a  la  memoria  del  ordenador,  que  depende  de  la  forma  en  que  el  algoritmo  esté 
codificado. 


1.5.  Sugerencias  para  seguir  leyendo 

Para  un  estudio  detallado  de  la  implement ación  de  la  aritmética  en  punto  flotante  y  la  adopción  del 
estándar  IEEE,  véase  Higham  (2002).  Una  buena  introducción  sobre  la  representación  de  los  números  se 
encuentra  en  Wilkinson  (1994).  La  mayoría  de  los  textos  de  cálculo  numérico  tienen  algún  tipo  de  introducción 
al  estudio  de  errores.  Para  un  punto  de  vista  similar  al  de  este  capítulo,  véanse:  [TI  125],  Atkinson  (1989)  o 
Stoer  y  Bulirsch  (2002).  A  modo  de  complemento,  también  se  puede  consultar  [22],  donde  se  tratan  los 
fundamentos  del  cálculo  científico  de  manera  extensa. 


1.6.  Ejercicios 

1.  Utilícese  el  polinomio  de  Taylor  de  grado  7  de  la  función  f(x)  =  ex  alrededor  de  0  para  aproximar 
los  valores  de  e-3  y  1/e2 3 4 *.  ¿Cuál  de  los  dos  valores  obtenidos  da  mayor  precisión  del  valor  real  e-3  = 
4.979  •  10-2  con  4  cifras  significativas?  ¿Por  qué? 

2.  Utilícese  el  polinomio  de  Taylor  de  la  función  f(x)  =  sem  alrededor  de  0  para  aproximar  sen(2.3)  con 
una  exactitud  de  10-3. 

,  p  12 

3.  Determínese  la  precisión  de  la  aproximación  de  J1  ex  dx  =  1.462651745907  cuando  se  reemplaza  la 
función  ex‘  por  su  polinomio  de  Taylor  de  grado  8  alrededor  de  0. 

4.  Calcúlense  los  errores  absoluto  y  relativo  que  se  cometen  cuando  el  número  .xyz  x  107  se  escribe 

erróneamente  como  x.yz  x  107. 
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5. 

6. 

7. 


9. 

10. 

11. 

12. 

13. 


14. 


15. 


16. 


¿Cuántos  números  de  punto  flotante  hay  entre  sucesivas  potencias  de  2? 

Determínese  el  número  en  punto  flotante  f  1(4/5)  y  calcúlense  los  errores  de  redondeo  absoluto  y  relativo 
que  se  cometen  al  representar  4/5  por  f  1(4/5). 

Determínese  el  número  de  punto  flotante  fl(V 5)  utilizando  redondeo  a  10  cifras  significativas. 

Dados  los  siguientes  valores  de  x  y  x 


a)  x  =  V5  y  x  —  2.2,  b)  x  =  1/9  y  x  =  0.111,  c)  x  =  y  x  =  0.022,  d)  x  =  10/9  y  x  =  1.11, 

determínense  los  errores  absoluto  y  relativo  cuando  aproximamos  x  por  x. 

Determínense  cuántos  números  diferentes  contiene  el  conjunto  F(/3,  t,  L1  U). 

Determínense  cuántos  números  pertenecen  al  conjunto  F(2,2,  —2,2)  y  cuál  es  el  valor  de  €m  para  este 
conjunto. 

Represéntese  en  precisión  simple,  según  el  estándar  IEC559,  el  número  decimal  —34.2137. 


Búsquense  ejemplos  en  los  que  se  ponga  de  manifiesto  que  el  producto  de  números  en  punto  flotante  no 
verifica  la  propiedad  asociativa;  es  decir,  fl(fl(xy)z)  ^  fl(xfl(yz )),  para  los  números  de  punto  flotante 
x,  y,  z. 


La  ecuación  x2  —  100.0001a:  +  0.01  =  0  tiene  dos  soluciones  exactas:  Xi  =  100  y  X2  =  0.0001.  Obsérvese 
lo  que  se  obtiene  si  calculamos  X\  y  x2  con  aritmética  de  punto  flotante  con  5  decimales  mediante  las 
conocidas  fórmulas 


Xi 


— b  +  \/b2  —  4ac 
2  a 


y 


x2 


—b  —  Vb2  —  4ac 
2  a 


que  calculan  las  raíces  de  la  ecuación  ax2  +  bx  +  c  =  0,  a  0.  ¿Qué  ocurre?  Calcúlese  a  continuación 
la  solución  x2  mediante  la  expresión  equivalente 


x2 


-2c 

b  —  \/b2  —  4ac 


¿Qué  conclusión  se  puede  dar? 

/1\" 

Justifiqúese  que  si  generamos  la  sucesión  an  =  (  -  I  ,  n  €  N,  de  forma  recursiva  mediante  «o  =  1  y 

an  =  para  n  £  N,  utilizando  redondeo  a  6  cifras  significativas,  la  sucesión  es  estable,  mientras 

que  si  la  generamos  a  partir  de  «o  =  1,  a\  =  ^  y  an  =  y«„_i  —  an~2,  para  n  >  2,  la  sucesión  es 
inestable. 


La  sucesión  de  Fibonacci  se  define  mediante 


0¿ 0  1;  Oq  —  1}  CIn+l  Qn  Oin—  1,  XI  £  M. 

Demuéstrese  que  la  sucesión  <  — — 

0¿n—  1 

sen  n,  77,  — |—  3 

Dadas  las  sucesiones  an  =  - -  y  (3n  =  — 5—,  n  G  N,  demuéstrese  que  la  sucesión  {/?„}  converge  a  0 

n  11/ 

más  rápidamente  de  lo  que  lo  hace  la  sucesión  {an}. 


n  £  N,  converge  a 


1  + 


Capítulo  2 


Resolución  de  sistemas  lineales 


2.1.  Introducción 

A  menudo  tenemos  que  resolver  un  sistema  de  ecuaciones  lineales,  o  simplemente  sistema  lineal,  de  la 
forma 

Ax  =  b, 

donde  A  es  una  matriz  cuadrada  de  orden  n  x  n  cuyos  elementos  a¡j  son  reales  o  complejos,  mientras  que 
x  y  b  son  dos  vectores  columna  de  orden  n  x  1  con  x  representando  la  solución  desconocida  y  b  un  vector 
dado.  Componente  a  componente,  el  sistema  anterior  se  puede  escribir  como 


OllAl 

+ 

0-12X2 

+  ■  ■ 

■  + 

Q'lnZ'n 

-o 

11 

021X1 

+ 

022X2 

+  '  ' 

■  + 

0*2  n%n 

—  62 

dnlXl 

+ 

On2X2 

+  '  ' 

■  + 

Q,nn%n 

= 

La  solución  del  sistema  existe  si  y  solo  si  la  matriz  A  es  no  singular.  En  principio,  la  solución  podría  calcularse 
utilizando  la  conocida  regla  de  Cramer: 

det(A¿)  . 

I,=  de¡W  ,  =  I'2 . 

donde  A¿  es  la  matriz  obtenida  a  partir  de  A  reemplazando  la  ¿-ésima  columna  por  b  y  det(A)  denota 
el  determinante  de  A.  Si  los  n  +  1  determinantes  se  calculan  mediante  la  conocida  expresión  recursiva  de 
Laplace,  se  requiere  un  número  total  de  aproximadamente  2 (n  +  1)!  operaciones  (sumas,  restas,  productos  o 
divisiones).  Por  ejemplo,  si  n  =  24,  se  calcularía  la  suma  de  24!  sumandos  (el  número  de  permutaciones  del 
conjunto  1,2, .. .  ,24),  y  con  un  ordenador  capaz  de  realizar  1015  operaciones  en  punto  flotante  por  segundo 
(1015  flops),  se  necesitarían  20  años  para  llevar  a  cabo  este  cálculo.  El  coste  computacional  es  entonces 
demasiado  alto  para  grandes  valores  de  n  que  surgen  a  menudo  en  las  aplicaciones  prácticas.  Por  tanto,  hay 
que  recurrir  a  algoritmos  más  eficientes. 

Pueden  utilizarse  dos  familias  de  métodos  alternativos:  los  llamados  métodos  directos,  que  dan  la  solución 
del  sistema  en  un  número  finito  de  pasos,  o  los  métodos  iterativos,  que  requieren  (en  principio)  un  número 
infinito  de  pasos.  La  elección  entre  métodos  directos  e  iterativos  puede  depender  de  varios  factores:  en  primer 
lugar,  de  la  eficiencia  teórica  del  esquema,  pero  también  del  tipo  particular  de  matriz,  de  la  memoria  de 
almacenamiento  requerida  y,  finalmente,  de  la  arquitectura  del  ordenador. 

2.2.  Métodos  directos 

Los  métodos  directos  consisten  en  transformar  el  sistema  Ax  =  b  en  otro  equivalente  cuya  resolución  sea 
prácticamente  inmediata.  Esta  transformación  se  hace  mediante  las  llamadas  operaciones  elementales,  cuya 
interpretación  matricial  nos  proporciona  una  interesante  y  conocida  factorización  de  la  matriz  del  sistema. 
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2.2.1.  Método  de  eliminación  de  Gauss 


El  método  directo  de  resolución  de  sistemas  de  ecuaciones  lineales  más  conocido  es  el  método  de  elimi¬ 
nación  de  Gauss,  que  consiste  en  transformar  el  sistema  Ax  =  b,  mediante  operaciones  elementales,  en  un 
sistema  equivalente  triangular  superior,  cuya  resolución  es  más  sencilla  y  se  obtiene  mediante  la  denominada 
sustitución  regresiva  o  inversa.  Recordamos  que  por  operaciones  elementales  entendemos  permutar  ecuacio¬ 
nes,  multiplicar  una  ecuación  por  una  constante  distinta  de  cero  y  sumar  a  una  ecuación  una  combinación 
lineal  del  resto  de  ecuaciones.  Es  bien  sabido  que  la  solución  del  sistema  no  cambia  al  realizar  estas  operaciones 
elementales. 

Inicialmente  denotamos  A Ó)  =  A  y  =  b.  El  método  lo  podemos  interpretar  como  una  sucesión  de 
n  —  l  pasos  que  dan  como  resultado  una  sucesión  de  matrices  y  vectores,  como  se  indica  a  continuación: 

A^  -►  A W  -> - +  A<n\  b(1)  ->  b(2)  -> - +  b(n), 

de  forma  que  A^A  sea  una  matriz  triangular  superior.  Así,  para  el  primer  paso,  supondremos  que  = 
Oh  yf  0.  Entonces,  podemos  eliminar  X\  de  las  n  —  1  últimas  ecuaciones.  En  efecto,  tomamos  £¿i  =  aa/au 
(para  i  =  2, . . . ,  n)  y  sumamos  —t¿-¡  veces  la  primera  ecuación  a  la  í-ésima,  esto  es 


,(2) 


=  a. 


(i) 


Z-il  CL 


(i) 

y  > 


3  =  1,2, 


,n; 


n(2) 


=  b¡1)-eilb?). 


(Notemos  que  J 1  designan  los  elementos  de  AÓ)  y  son  las  componentes  de  b(1^).  Si  y^  0,  podemos 
eliminar  de  manera  similar  x2  de  las  n  —  2  últimas  ecuaciones  y  así  sucesivamente.  En  general,  el  paso  de  la 
fc-ésima  matriz  a  la  ( k  +  l)-ésima  viene  dado  por  las  siguientes  fórmulas: 


donde 


a(fc+1)  = 

aij 


%  >  í  =  l,2,...,fc, 

-  tik  ajy ,  i,  j  =  k  +  1,  k  +  2, . . . ,  n, 

0,  i  =  k  +  1,  k  +  2, . . . ,  n;  j  =  1, 2, . . . ,  k, 


"ik  — 


(fe) 

alk 

w’ 


a 


kk 


i, 

o, 


i  =  k  +  1,  k  +  2, . . . ,  n, 
i  =  k, 

i  =  1, 2, . . . ,  k  —  1. 


Como  hemos  visto,  si  los  elementos  que  van  apareciendo  en  los  sucesivos  pasos  (que  denominaremos 
pivotes)  son  no  nulos,  podemos  aplicar  el  algoritmo  con  éxito. 


Después  de  a  lo  sumo  n  pasos,  llegamos  al  sistema  triangular  superior 

A^x  =  b(n')  siguiente 

(n)  (n) 

a\iX i  +  a\2  X2  +  •* 

■  + 

(n) 

alnxn  = 

ui  > 

(n) 

a2 2X2  +  '  ' 

■  + 

(n) 

0>2nXn  = 

^2  j 

_  (n) 

®nn  Xn  — 

b{n) 

Un  5 

que  podemos  resolver  sin  más  que  llevar  a  cabo  sustitución  regresiva 


xn  = 


%n—  1  — 


/,(") 

un 

~Jñj' 

Qnn 

/>(")  _  T 
un- 1  an- l,nxn 


xn—  l,n—  1 


k(n) 


Xk 


En 
7  = 


(n) 

j=k  •  I  akj  xó 


lkk 


para  cada  k  =  n  — 


1, n  —  2, . . . ,  1. 
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El  procedimiento  fallará  si  en  el  paso  fc-ésimo  el  pivote  akk  es  cero,  porque  en  ese  caso,  o  bien  los 
multiplicadores  ¿ik  =  no  están  definidos  (lo  que  ocurre  si  =  0  para  algún  k  <  n)  o  no  podemos 

realizar  la  sustitución  regresiva  (si  a'nrl  =  0).  Esto  no  significa  que  el  sistema  no  tenga  solución,  sino  más  bien 
que  la  técnica  para  hallar  la  solución  debe  modificarse. 

Ejemplo.  Vamos  a  resolver  el  sistema  lineal  dado  en  forma  matricial  por 


/ 

1 

1 

1 

1  ^ 

f  Xi  ) 

í 

10  \ 

2 

3 

1 

5 

x2 

31 

-1 

1 

-5 

3 

X3 

-2 

V 

3 

1 

7 

-2  J 

\  X4  ) 

\ 

18  j 

La  matriz  ampliada  junto  con  los  multiplicadores  ln  son 


pivote  — > 

(m 

1 

1 

1 

10  \ 

¿21  =  2 

2 

3 

1 

5 

31 

4i  =  -1 

-1 

1 

-5 

3 

-2 

¿41  =  3 

v  3 

1 

7 

-2 

i8  y 

Ahora  hacemos  ceros  por  debajo  del  pivote  restando  múltiplos  de  la  primera  ecuación  ( primera  ecuación 
pivote)  de  las  otras  tres 


(  1 

1 

1 

1 

10  \ 

pivote  — > 

0 

0 

-1 

3 

11 

(32  =  2 

0 

2 

-4 

4 

8 

¿42  =  -2 

l  0 

-2 

4 

—5 

-12  y 

A  continuación,  hacemos  ceros  por  debajo  del  nuevo  pivote  restando  múltiplos  de  la  segunda  ecuación  ( segunda 
ecuación  pivote )  de  las  dos  últimas 


(  1 

1 

1 

1 

10  \ 

0 

1 

-1 

3 

11 

pivote  — > 

0 

0 

-2 

—2 

-14 

¿43  =  — 1 

l  0 

0 

2 

1 

10  y 

Restamos  finalmente  múltiplos  de  la  tercera  ecuación  ( tercera  ecuación  pivote)  de  la  última  para  hacer  ceros 
por  debajo  del  último  pivote  y  obtener  así  el  siguiente  sistema  triangular  superior: 


í  1 

1 

1 

1 

10  \ 

0 

1 

-1 

3 

11 

0 

0 

-2 

-2 

-14 

V  0 

0 

0 

-1 

-4  y 

Para  terminar,  aplicamos  sustitución  regresiva  al  sistema  anterior  y  obtenemos: 


£4  =  4,  x3 


— 14  2x4 

^2 


=  3, 


X2  =  11  +  X3 


3X4  =  2,  ¡El  =  10  —  X2  —  x3  —  X4  =  1. 


□ 


Nota.  Obsérvese  en  el  ejemplo  anterior  que  podemos  utilizar  los  pasos  que  se  dan  para  resolver  el  sistema 
lineal  Ax  =  b  por  el  método  de  eliminación  de  Gauss  para  hallar  la  matriz  triangular  superior 


( 1 

1 

1 

0 

1 

-1 

3 

0 

0 

-2 

-2 

1 0 

0 

0 

-1  y 

/  1 

1 

1 

2 

3 

1 

5 

-1 

1 

-5 

3 

V 

3 

1 

7 

-2  y 

de  la  matriz 
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2.2.2.  Estrategias  de  pivoteo 

En  el  algoritmo  de  eliminación  de  Gauss  hemos  supuesto  que  todos  los  pivotes  son  no  nulos.  Pero  esto 
no  ocurre  en  muchas  ocasiones,  o  aunque  ocurra,  si  el  pivote  es  muy  pequeño,  puede  provocar  resultados 
inexactos,  como  puede  comprobarse  en  los  siguientes  dos  ejemplos  que  aparecen  en  E3: 


í  y  =  1,  í  ex  +  y  =  1, 

\  x  +  y  =  2,  \  x  +  y  =  2, 

donde  e  es  un  número  muy  pequeño  pero  distinto  de  cero.  Las  estrategias  de  pivoteo  evitan  parcialmente 
estos  problemas. 

A  partir  de  los  dos  ejemplos  anteriores  y  otros  parecidos  se  puede  extraer  la  idea  de  que  el  intercambio 
de  ecuaciones  (filas)  en  un  sistema,  cuando  la  situación  lo  requiera,  es  una  buena  estrategia.  Así,  si  =  0, 
entonces,  podemos  buscar  a^}  ^  0  con  i>  k  { lo  cual  es  siempre  posible  ya  que  det(A)  ^  0),  intercambiar  las 
filas  fc-ésima  e  i-ésima  y  continuar  el  proceso.  Este  intercambio  de  filas  se  conoce  como  pivoteo. 

Si  aKkk  ^  0  pero  es  pequeño,  aunque  el  método  de  Gauss  se  puede  aplicar,  es  muy  inestable  numéricamente, 
con  lo  que  pequeños  errores  en  los  datos  pueden  originar  grandes  cambios  en  la  solución  (véase  el  ejemplo  1 
de  la  pág.  268  de  El)-  En  este  caso,  también  se  tendrá  que  pivotar. 

En  el  método  general  de  eliminación  de  Gauss  se  puede  utilizar  una  ecuación  (o  fila)  como  ecuación  pivote 
(o  fila  pivote)  solo  si  el  elemento  pivote  no  es  cero.  Si  el  elemento  pivote  es  cero,  la  ecuación  (fila)  se  puede 
intercambiar  con  una  de  las  ecuaciones  (filas)  que  están  por  debajo  que  tenga  un  elemento  pivote  no  cero. 
Las  opciones  de  pivoteo  más  habituales  que  se  utilizan  en  el  paso  &-ésimo  son: 

■  Pivoteo  parcial:  se  toma  como  pivote  el  elemento  de  mayor  módulo  de  entre  los  n—k  últimos  elementos 
de  la  columna  fc-ésima;  es  decir,  se  elige  (i  =  k,  k  +  1, . . . ,  n)  de  forma  que 


lik 


max 

k<.j<n 


,(*0 


e  intercambiamos  las  filas  i-ésima  y  fc-ésima. 

■  Pivoteo  total:  se  toma  como  pivote  el  elemento  de  mayor  módulo  de  la  submatriz  correspondiente  de  la 
matriz  A es  decir,  se  elige  el  elemento  (i,  j  =  k,  k  +  1, . . . ,  n)  de  modo  que 


Ak) 


max 

k<.r,s<n 


,(fc) 


e  intercambiamos  las  filas  y  columnas  correspondientes.  En  este  pivoteo,  si  el  pivote  elegido  no  está  en 
la  columna  fc-ésima,  el  intercambio  de  columnas  que  hay  que  realizar  implica  intercambiar  el  orden  de 
las  incógnitas,  lo  que  habrá  que  tener  en  cuenta  a  la  hora  de  resolver  el  sistema  lineal. 

Como  con  el  pivoteo  parcial  solo  hay  que  intercambiar  filas  de  la  matriz,  mientras  que  con  el  pivoteo 
total  también  hay  que  intercambiar  columnas,  el  coste  operacional  de  este  último  es  mucho  más  elevado.  En 
general,  esto  hace  que  en  el  método  de  eliminación  de  Gauss  se  utilice  habitualmente  la  estrategia  de  pivoteo 
parcial. 

Comentario  adicional.  >  En  el  ejemplo  anterior  hemos  podido  aplicar  el  método  de  eliminación  de 
Gauss  sin  necesidad  de  pivoteo,  pero  ¿cuándo  podemos  asegurar  que  no  será  necesario  hacerlo?  Digamos, 
en  este  caso,  que  si  la  matriz  A  es  simétrica  definida  positiva  (es  decir,  A  =  AT  y  tal  que  xTAx  >  0, 
para  todo  vector  columna  x/0)o  estrictamente  diagonal  dominante  (esto  es  que  los  elementos 
de  A  cumplen  que  a,;¿  >  X^j=i  \aij\  Para  *  =  1,2, ... ,  n),  el  algoritmo  de  Gauss  es  numéricamente 
estable  y  se  puede  llevar  a  cabo  sin  necesidad  de  pivoteo.  Dos  equivalencias  que  hacen  más  fácil,  en 
algunos  casos,  ver  que  una  matriz  simétrica  es  definida  positiva  son:  una,  que  todos  sus  valores  propios 
son  >  0;  y  dos,  que  sus  n  menores  principales  son  >  0. 


2.2.3.  Métodos  de  factorización 

Hemos  visto  que  el  método  de  eliminación  de  Gauss  consiste  de  dos  partes.  La  primera  parte  es  el 
procedimiento  de  eliminación  en  el  que  el  sistema  de  ecuaciones  lineales  Ax  =  b  se  transforma  en  un  sistema 
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equivalente  de  ecuaciones  A'x  =  b',  donde  la  nueva  matriz  de  coeficientes  A'  es  triangular  superior.  En 
la  segunda  parte,  el  sistema  equivalente  se  resuelve  mediante  sustitución  regresiva.  El  procedimiento  de 
eliminación  requiere  de  muchas  operaciones  matemáticas  y  significativamente  más  tiempo  de  computación 
que  los  cálculos  de  la  sustitución  regresiva.  Durante  el  procedimiento  de  elimanción  la  matriz  de  coeficientes 
A  y  el  vector  b  cambian,  lo  que  significa  que  si  tenemos  la  necesidad  de  resolver  varios  sistemas  de  ecuaciones 
que  tengan  la  misma  matriz  de  coeficientes  A,  pero  diferentes  vectores  b,  el  procedimiento  de  eliminación 
tiene  que  realizarse  para  cada  uno  de  los  vectores  b.  Esto  se  puede  mejorar  si  las  operaciones  asociadas  a  la 
matriz  A  se  disocian  de  las  operaciones  asociadas  al  vector  b.  De  esta  forma,  el  procedimiento  de  elimación 
con  A  se  hace  una  sola  vez  y  se  utiliza  entonces  para  resolver  los  sistemas  de  ecuaciones  con  distintos  b. 

Una  opción  para  resolver  varios  sistemas  de  ecuaciones  de  la  forma  Ax  =  b  que  tengan  la  misma  matriz  A 
pero  diferentes  vectores  b  es  calcular  primero  la  matriz  inversa  A -1  de  A  y,  una  vez  que  esta  matriz  inversa  es 
conocida,  la  solución  se  puede  calcular  así:  x  =  A_1b.  Sin  embargo,  el  cálculo  de  la  matriz  inversa  requiere  de 
muchas  operaciones  matemáticas  y  computacionalmente  es  ineficiente.  Un  método  más  eficiente  para  calcular 
la  solución  x  es  el  método  de  factorización  LU. 

En  el  método  de  factorización  LU  las  operaciones  con  la  matriz  A  se  realizan  sin  utilizar,  o  cambiar, 
el  verctor  b,  que  se  utiliza  solo  en  la  parte  de  sustitución  de  la  solución.  En  este  caso,  sea  A  una  matriz 
cuadrada  de  orden  n  y  supongamos  que  existen  dos  matrices  convenientes  L  y  U,  triangular  inferior  y 
triangular  superior,  respectivamente,  tales  que  A  =  LU.  Llamamos  a  la  igualdad  anterior  una  factorización 
LU  (o  descomposición)  de  A.  Si  A  es  no  singular,  lo  mismo  ocurre  con  L  y  U,  y  de  este  modo  sus  elementos 
diagonales  son  no  nulos. 

En  tal  caso,  resolver  Ax  =  b  conduce  a  la  solución  de  los  dos  sistemas  triangulares  Lz  =  b  y  t/x  =  z.  Se 
puede  proceder  por  etapas  como  sigue: 

1.  Resolución  de  Lz  =  b  para  z  por  sustitución  progresiva: 


bi 


%k  —  fí  (Pk  1~1  ^k2%2  '  '  '  t-k.k  —  lZk  —  l)  i  ^  —  2,  3,  .  .  .  ,  n. 

^ kk 

2.  Resolución  de  Ux  =  z  para  x  por  sustitución  regresiva: 

zn 

%n  —  5 

Xk  —  (-2/c  Uk,k-\-l%k-\-l  ^fc,fc+2*£fc+2  *  V'kri’En)  ■>  k  —  &  1,  /c  2,  .  .  .  ,  1. 

'U'kk 

En  este  punto  necesitamos  un  algoritmo  que  permita  un  cálculo  efectivo  de  los  factores  L  y  U  de  la  matriz 
A. 

La  factorización  anterior  se  puede  obtener  simplemente  mediante  la  fórmula  del  producto  de  matrices, 
que  conduce  a  un  sistema  lineal  de  n2  ecuaciones  en  el  que  las  incógnitas  son  los  n2  +  n  coeficientes  de  las 
matrices  triangulares  L  y  U.  Así,  si  A  =  (a¿j),  L  =  (tij)  y  U  =  (u¿j),  donde  los  elementos  tij  y  utj  están  por 
determinar,  realizando  el  producto  se  tiene  que 

mín  (i,j) 

Qij  =  ^  '  tip  Upj ,  i.  j  -  1,2,...,  TI , 

P- 1 

donde  la  última  igualdad  se  debe  a  que  tiP  =  0,  para  p  >  i,  y  uPj  =  0,  para  p  >  j.  Entonces,  si  fijamos  de 
antemano  el  valor  de  ¿a  o  de  uit  (distinto  de  cero),  para  todo  i ,  la  igualdad  anterior  permite  el  cálculo  de  L 
y  U,  dando  lugar  a  formas  compactas  de  factorización. 

Factorización  de  Doolittle 

Si  se  fija  tu  =  1,  para  todo  i ,  la  factorización  correspondiente  se  denomina  factorización  de  Doolittle ,  o 
simplemente,  factorización  LU. 

Si  podemos  aplicar  el  método  de  eliminación  de  Gauss  sin  pivoteo  a  la  matriz  A,  teniendo  cuidado  de 
guardar  los  mulplicadores  Ufe  en  una  matriz  L  con  elementos  1  en  su  diagonal,  y  llamamos  U  a  la  matriz 
triangular  superior  obtenida  tras  la  aplicación  del  método  de  Gauss,  se  tiene  que  A  =  LU. 
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Ejemplo.  En  la  matriz  A  del  ejemplo  anterior  se  tiene  que  la  matriz  L  de  la  factorización  LU  =  A  se 
construye  a  partir  de  los  coeficientes  t¿ k ,  obtenidos  en  dicho  ejemplo,  de  la  siguiente  forma 


L  = 


Comprobamos  que  la  factorización  es  correcta 


/  1 

0 

0 

0  1 

(  1 

0 

0 

0  \ 

¿21 
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0 

2 

1 

0 

0 

¿31 

¿32 
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0 

-1 

2 

1 

0 

V  ¿41 

¿42 

¿43 

1 ) 

l  3 

-2 

-1 

1  / 

LU  = 


(  1  0 

2  10  0 

-12  10 
\  3  -2  -1  1  ) 


0  0  \  /  1  1 
0  1 
0  0 
\  0  0 


1  \ 

3 

-2 
-1 


1  1 

2  3 
-1  1 

3  1 


1  \ 

5 

3 

) 


=  A.  □ 


Comentario  adicional.  >  Una  matriz  A  tiene  factorización  de  Doolittle  si  y  solo  si  se  le  puede  aplicar 
el  método  de  eliminación  de  Gauss  sin  pivoteo. 


Factorización  de  Crout 

La  factorización  de  Crout  es  similar  a  la  Doolittle,  pero  con  la  diferencia  de  que  ahora  fijamos  un  =  1, 
para  todo  i ,  de  manera  que  la  matriz  U  es  la  que  tiene  los  elementos  diagonales  iguales  a  1.  Véase  na  para 
mayor  detalle. 


Factorización  LU  con  pivoteo  (o  factorización  PA  =  LU) 

Para  realizar  las  factorizaciones  anteriores  de  Doolittle  y  Crout,  hemos  supuesto  que  es  posible  realizar 
todos  los  cálculos  sin  pivoteo.  Si  se  utiliza  pivoteo,  entonces  las  matrices  L  y  U  que  se  obtienen  no  son 
la  factorización  de  la  matriz  original  A.  El  producto  LU  da  una  matriz  con  filas  que  tienen  los  mismos 
elementos  que  A,  pero  como  consecuencia  del  pivoteo,  las  filas  están  en  un  orden  diferente.  Cuando  se  utiliza 
el  intercambio  de  filas  como  operación  elemental  en  el  método  de  Gauss,  éste  lleva  consigo  una  modificación 
menor  en  la  factorización  LU,  y  los  cambios  que  se  han  hecho  tienen  que  ser  grabados  y  almacenados.  Esto 
se  puede  hacer  creando  una  matriz  P,  llamada  matriz  de  permutación,  tal  que  PA  =  LU  y  donde  P  es  el 
resultado  de  permutar  filas  en  la  matriz  identidad.  En  este  caso,  P  contiene  información  sobre  el  orden  que 
impone  el  método  de  eliminación  de  Gauss  con  pivoteo,  y  por  tanto  es  equivalente  a  reordenar  la  matriz  A 
de  acuerdo  a  ese  orden  y  aplicar  luego  el  método  de  eliminación  de  Gauss  sin  pivoteo.  Si  las  matrices  L  y  U 
se  utilizan  para  resolver  un  sistema  de  ecuaciones  Ax  =  b,  entonces  hay  que  cambiar  el  orden  de  las  filas  de 
b  para  que  sea  consistente  con  el  pivoteo.  Esto  se  consigue  multiplicando  b  por  la  matriz  de  permutaicón, 
P b.  Para  mayor  detalle  puede  consultarse  [TI]. 

Alternativamente,  véase  [6],  la  factorización  PA  =  LU  se  puede  escribir  como  A  =  LU,  donde  L  =  P_1L, 
de  forma  que  L  es  una  permutación  de  la  matriz  triangular  inferior  (que  es  el  resultado  de  reordenar  las  filas 
de  L). 


Ejemplo.  La  matriz 

111 
112 
12  2 

tiene  el  menor  principal  2x2  nulo,  luego  no  tiene  factorización  de  Doolitte  y,  por  tanto,  no  es  posible  aplicar 
el  método  de  eliminación  de  Gauss  sin  pivoteo.  Es  necesario  permutar  las  filas  2  y  3  para  llevar  a  cabo  el 
método  de  eliminación  de  Gauss;  es  decir,  se  necesita  pivoteo.  Si  multiplicamos  entonces  la  matriz  A  por  la 
matriz  de  permutación  de  filas  2  y  3 


/I 

0 

°\ 

A 

1 

A 

P=  0 

0 

1  , 

se  tiene  la  matriz  PA  =  1 

2 

2 

\0 

1 

0/ 

ll 

1 

2/ 

que  ya  no  necesita  pivoteo,  puesto  que  los  tres  menores  principales  de  PA  son  mayores  que  cero.  □ 


2.3.  MÉTODOS  ITERATIVOS 
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Factorización  de  Cholesky 

El  algoritmo  para  la  factorización  de  Cholesky  es  el  caso  especial  del  algoritmo  general  para  la  factorización 
LU  en  el  que  U  =  LT ,  de  modo  que  £„  =  Un ,  para  i  =  1,  2, . . . ,  n.  Si  A  es  simétrica  definida  positiva,  entonces 
tiene  una  factorización  única  de  la  forma  A  =  LLT ,  donde  L  es  triangular  inferior  con  todos  los  elementos 
de  la  diagonal  positivos.  Como 


n  mín(¿,j) 

lij  =  y  '  £ip  Upj  =  y  '  £ip  ijp 

P—  1  P—  1 


(  k~i  y 

£kk  =  —  'y  '  £-kp  J  s 


y  los  valores  tkk  quedan  determinados.  Así,  los  elementos  de  la  matriz  L  se  obtienen  de  la  siguiente  forma. 
Para  k  =  1, 2, . . . ,  n,  se  tiene: 

/  k-i  y  x  /  fc-i  \ 

£kk  —  í  Hfcfc  ^  '  £ kp  J  ?  £ik  —  ~n  í  ^ik  y  ^  £ip  £kp  J  >  í  k  1 ,  k  2,  .  .  .  ,  TI. 

\  P= i  /  ^fcfc  V  P= i  / 

Estas  igualdades  pueden  deducirse  escribiendo  la  igualdad  A  =  LLT  como  un  sistema  de  ecuaciones. 

Ejemplo.  Factorizaremos  mediante  el  método  de  Cholesky  la  siguiente  matriz 

16  4  4 

A  =  |  4  26  6 

4  6  11 


De  las  fórmulas  anteriores,  obtenemos 


£\\  —  4; 


=  1, 


=  5; 


t31 


=  1, 


(-32 


Luego, 


U  =  Lt  = 


—  1,  £33  —  3. 


□ 


Comentario  adicional.  >  Los  métodos  de  factorización  LU  son  particularmente  útiles  cuando  se  ne¬ 
cesita  resolver  un  conjunto  de  sistemas  Axj  =  bj,  j  =  1,2,...,  n,  que  tienen  la  misma  matriz  cuadrada 
de  coeficientes  A.  En  muchos  problemas  de  la  ciencia  y  la  ingeniería  aparecen  sistemas  de  este  tipo  y,  en 
este  caso,  es  más  eficiente  utilizar  métodos  LU  que  aplicar  separadamente  el  método  de  eliminación  de 
Gauss  a  cada  uno  de  los  n  sistemas.  Este  método  es  especialmente  útil  para  calcular  la  matriz  inversa 
de  A  (véase  ejercicio  el  5).  Además,  se  puede  economizar  el  espacio  de  almacenamiento  al  no  necesitar 
almacenar  los  ceros  de  L  o  U  y  los  unos  de  la  diagonal  de  L  o  U  (según  sea  la  factorización),  de  manera 
que  las  matrices  L  y  U  se  construyen  almacenando  sus  elementos  en  el  espacio  de  A. 


2.3.  Métodos  iterativos 

Los  métodos  estudiados  hasta  ahora  se  llaman  métodos  directos  porque  encuentran  la  solución  exacta  tras 
un  número  finito  de  pasos  (salvo  errores  de  redondeo) .  A  continuación  estudiaremos  otros  métodos,  llamados 
iterativos,  que  si  bien  necesitarían  un  número  infinito  de  pasos  para  alcanzar  la  solución,  permiten  aproximarla 
tras  un  número  finito.  Además  están  mejor  adaptados  a  la  resolución  de  grandes  sistemas  lineales,  sobre  todo 
si  estos  están  dados  por  matrices  con  un  alto  porcentaje  de  elementos  nulos  ( matrices  dispersas). 

La  idea  básica  de  un  método  iterativo  para  resolver  el  sistema  Ax  =  b  consiste  en  construir  una  sucesión 

de  vectores  . . .  ,Xn  ^  ;  k  €  n|  de  R”  que  converja  a  la  solución  exacta  x,  esto  es 

lím  x(fc)  =  x, 

k — »oo 


para  un 


vector  inicial  dado  x^  de  R". 
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Una  técnica  general  para  construir  un  método  iterativo  se  basa  en  una  descomposición  de  la  matriz  A  del 
sistema  Ax  =  b  en  la  forma  A  =  M  —  (M  —  A),  donde  M  es  una  matriz  no  singular  adecuada  (llamada  el 
precondicionador  de  A).  Entonces 

Mx  =  (M  -  A)x  +  b, 

que  tiene  la  forma  x  =  Tx  +  c,  donde  T  =  M~1(M  —  A)  es  una  matriz  n  x  n,  llamada  matriz  de  iteración , 
y  c  =  M~l  b.  En  correspondencia  con  esta  descomposición  y  después  de  seleccionar  un  vector  inicial  'x(A\ 
podemos  definir  el  siguiente  método  iterativo: 

x(fc)  =  Tx(fc-1}  +  c,  k  G  N. 

Si  el  proceso  converge,  el  límite  es  solución  de  la  ecuación  planteada  y,  por  tanto,  solución  del  sistema  inicial. 
El  sistema  inicial  es  fácil  de  resolver  si  M  es  fácil  de  invertir,  en  el  sentido  de  que  sea  fácil  resolver  un  sistema 
asociado  a  dicha  matriz,  como  por  ejemplo  ocurre  cuando  M  es  una  matriz  diagonal  o  triangular. 

A  continuación  nos  planteamos  cuándo  la  sucesión  anterior  convergerá  a  la  solución.  Si  denotamos  el  error 
cometido  en  la  fc-ésima  iteración  por  e ^  =  x^U  —  x,  se  verifica  que 

e(fc)  =  x(*0  x  =  (Tx^-1)  +  c)  -  (Tx  +  c)  =  T(x{k~1)  -  x)  = 


y,  por  tanto, 

e(U  =  Te(fe_1)  =  T2e(fc_2)  =  •  •  •  =  Tfce(0),  k  G  N. 

Así,  el  error  en  las  iteraciones  depende  fundamentalmente  de  las  potencias  sucesivas  de  la  matriz  T.  A 
continuación,  eligiendo  de  forma  conveniente  cualesquier  norma  vectorial  y  norma  matricial  subordinada, 
llegamos  a  la  desigualdad 

l|e(fc)||<im|fc||e(°)|[. 

Entonces,  si  ||T||  <  1,  podemos  concluir  de  inmediato  que  — >  0  cuando  k  — >  oo  para  cada  posible 
(y  por  tanto  x*0)).  A  continuación  damos  un  criterio  en  el  que  se  pone  de  manifiesto  que  esta  propiedad  es 
necesaria  para  la  convergencia. 

El  criterio  fundamental  de  convergencia  de  los  métodos  iterativos  solo  involucra  la  matriz  T  del 
método  iterativo  considerado  y  establece  que  son  equivalentes  (I SI): 

a)  el  método  asociado  a  la  matriz  T  es  convergente, 

b)  p(T )  <  1,  donde  p(T)  es  el  radio  espectral  de  la  matriz  T,  esto  es, 

p(T )  =  máx{|A|;  A  es  valor  propio  de  T}, 

c)  ||T||  <  1  para  alguna  norma  matricial. 

Las  normas  matriciales  subordinadas  son  normas  que  provienen  de  una  norma  vectorial.  Las  normas  ||  •  ||i 
y  ||  •  1 1 oo  son  ejemplos  de  tales  normas  (véanse  sus  definiciones  en  el  capítulo  anterior). 

COMENTARIOS  ADICIONALES.  >  A  la  hora  de  resolver  un  sistema  lineal  mediante  un  método  iterativo,  en 
primer  lugar  deberemos  asegurar  su  convergencia  (por  ejemplo,  encontrando  alguna  norma  para  la  cual 
||Tj|  <  1  o  viendo  que  p(T)  <  1).  A  continuación,  y  en  caso  de  disponer  de  varios  métodos  a  nuestro 
alcance,  elegiremos  aquél  cuya  matriz  asociada  tenga  una  norma  o  un  radio  espectral  menor. 

>  Como  en  un  método  iterativo  no  podemos  esperar  hallar  la  solución  exacta,  sino  calcular  una  aproxi¬ 
mación,  debemos  fijar  un  criterio  de  parada  que  dé  por  terminado  el  método  cuando  la  aproximación 
obtenida  se  considere  suficientemente  buena.  Una  posibilidad  es  medir  la  diferencia  entre  dos  iteraciones 
consecutivas  e  iterar  hasta  que 

x (fe)  —  x(fc_1) 

sea  tan  pequeño  como  una  cierta  cantidad  prescrita  e  >  0,  que  se  denomina  tolerancia,  de  manera  que 
se  considera  que  se  está  suficientemente  cerca  de  la  solución  y  se  finaliza  el  método.  Otros  criterios 
se  basan  en  la  diferencia  relativa  entre  dos  iteraciones  consecutivas  (véase  la  pág.  157  de  US]).  Ahora 
bien,  según  el  criterio  fundamental  de  convergencia,  la  convergencia  o  divergencia  del  método  iterativo 
solo  depende  del  carácter  de  las  propias  matrices,  pero  en  el  caso  de  que  haya  convergencia,  una  buena 
aproximación  inicial  hará  que  el  número  de  iteraciones  sea  relativamente  pequeño. 


2.3.  MÉTODOS  ITERATIVOS 
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>  Desde  un  punto  de  vista  computacional,  es  importante  evitar  que  el  método  entre  en  un  bucle  infinito. 
Para  ello,  se  suele  fijar  un  número  máximo  de  iteraciones  de  forma  que  si  se  supera,  se  termine  el  método 
con  un  mensaje  de  error.  (Existe  también  otro  problema:  que  la  solución  crezca  de  forma  que  supere  la 
cantidad  máxima  representable  en  punto  flotante  (overflow)) . 

2.3.1.  Los  métodos  de  Jacobi  y  Gauss-Seidel 

Si  los  elementos  diagonales  de  A  son  todos  distintos  de  cero,  podemos  escribir 

A  =  D  —  L  —  U, 

donde  D  es  la  matriz  diagonal  que  contiene  los  elementos  diagonales  de  A , 


La  ecuación  Ax  =  b  o  (D  —  L  —  U)x  =  b  se  transforma  entonces  en 

Dx  =  (L  +  U)x  +  b, 

y,  si  existe  D”1  (es  decir,  a¿¿  ^  0  para  todo  i),  entonces 

x  =  D^1(L  +  U)x  +  D^1  b. 

De  donde  se  obtiene  la  expresión  matricial  del  método  iterativo  de  Jacobi: 

X(fc)  =  Tj  x(fc^1}  +  Cj ,  para  cada  k  €  N, 
con  Tj  =  D~1(L  +  U)  y  c j  =  Z?_1b. 

Ejemplo.  Resolvemos  el  sistema 


7£i 

-  2£2 

+ 

X3 

=  17 

£1 

—  9£2 

+ 

3x3 

- 

X\ 

=  13 

2£i 

+ 

10£3 

+ 

X\ 

=  15 

£1 

-  X2 

+ 

x3 

+ 

6x4 

=  10 

mediante  el  método  de  Jacobi,  utilizando  una  tolerancia  e  =  10  3,  un  número  máximo  de  30  iteraciones  y  el 
vector  inicial  x^0)  =  0  =  (0, 0,  0, 0)T. 

En  primer  lugar,  reescribimos  las  ecuaciones  anteriores  de  la  forma 

X\  —  ^(17  +  2x2  -  x3) 
x2  =  |(— 13  +  xi  +  3x3  —  £4) 

£3  =  ¿(15  -  2Xl  -  £4) 

£4  =  |(10  -  £1  +  £2  -  £3), 

que  dan  el  siguiente  método  iterativo  de  Jacobi 

x[k+1)  =  1  (l7  +  2x(2k)  -  4fe)) 

4k+1)  =  I  (-13  +  x[k)  +  3x{k)  -  4fc)) 
x3+1)  =  ¿  (l5  -  2£ife)  -  *ik)) 

X{k+1)  =  1  (10  -  x[k)  +  X(k)  -  x{k) )  . 
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Sustituyendo  x^0)  =  (0,  0,  0, 0)T  en  el  lado  derecho  de  cada  una  de  las  ecuaciones  obtenemos 

41-*  =  |(17  +  2(0)  -  0)  =  2.428571429 
4°  =  g  ( — 13  +  0  +  3(0)  -  0)  =  -1.444444444 
*a1)  =  ra(15-2(0)-0)  =  1.5 
x i15  =  i  (10  -  0  +  0  -  0)  =  1.666666667. 

Luego,  x^1)  =  (2.428571429, —1.444444444, 1.5,  1.666666667)t.  Procediendo  de  la  misma  manera,  véase  m, 
se  genera  una  sucesión  convergente  a 

x(9)  =  (2.000127203, -1.000100162, 1.000118096,  1.000162172)t 


con  una  tolerancia  de  10  3  y  utilizando  la  norma  del  máximo  ||x|| oo  =  máx  \xt\.  □ 

A  continuación,  razónese  que  si  escribimos  =  (x[k\  x^, . . . ,  x„^  ,  se  tiene  que  el  valor  de  cada 
componente  de  la  iteración,  para  k  £  N,  es: 


1 

O'Ü 


n 

1=1,  iA 


para  cada  i  =  1, 2, . . . ,  n. 


Reconsiderando  la  última  igualdad  podemos  ver  algo  que  seguramente  mejora  el  método  de  Jacobi.  En 
dicha  ecuación  se  utilizan  todas  las  componentes  de  x^fc_1^  para  calcular  Puesto  que  las  componentes 
x[k\x^\  . . . ,  x"k}l  de  x(fc)  ya  se  han  calculado  y  son  probablemente  mejores  aproximaciones  de  las  soluciones 
exactas  x\,x-¿,... , i  que  x[k  A\x:k  1\.. . , x^^,  podemos  calcular  usando  estos  valores  calculados 
más  recientemente;  es  decir,  podemos  utilizar 


„(*9 


1 


i—  1  n 

-EHI-  E  {•»**?-") 


para  cada  i  =  1,2 , ,n. 


Esta  modificación  recibe  el  nombre  de  método  iterativo  de  Gauss-Seidel. 

Con  las  definiciones  de  D,  L  y  U  que  hemos  usado  antes,  razónese  que  el  método  de  Gauss-Seidel  se  puede 
representar  mediante 

X(fe)  =  Tg  x(k-1]  +  cg,  para  cada  k  G  N, 

donde  Tg  =  (D  —  L)_1/7  y  cg  =  (D  —  L)~1b.  Como  det(D  —  L)  =  011022  •  •  •  022,  la  matriz  triangular  inferior 
D  —  L  es  invertible  precisamente  si  7^  0  para  cada  i  =  1,2 , ,n. 

Comentario  ADICIONAL.  >  Como  consecuencia  de  que  los  nuevos  valores  se  pueden  almacenar  inmedia¬ 
tamente  en  el  lugar  de  los  valores  antiguos,  los  requerimientos  de  almacenamiento  para  x  con  el  método 
de  Gauss-Seidel  son  la  mitad  de  lo  que  serían  para  el  método  de  Jacobi. 


2.3.2.  Acerca  de  la  convergencia  de  los  métodos  de  Jacobi  y  Gauss-Seidel 

Por  un  lado,  según  el  criterio  fundamental  de  convergencia,  los  métodos  iterativos  de  Jacobi  y  de  Gauss- 
Seidel  convergen  si  y  solo  si  p(Tj)  <  1  y  p(Tg )  <  1.  Esto  es  una  condición  necesaria  y  suficiente,  pero  es 
necesario  calcular  el  radio  espectral,  lo  que  puede  ser  tan  costoso  de  calcular  como  resolver  el  sistema.  Sin 
embargo,  existen  condiciones  suficientes  que  aseguran  de  una  forma  más  sencilla  la  convergencia  de  ambos 
métodos. 


Resultados  de  convergencia 

Por  un  lado,  podemos  establecer  las  siguientes  propiedades  de  convergencia  a  priori  para  los  métodos  de 
Jacobi  y  de  Gauss-Seidel: 


2.4.  SUGERENCIAS  PARA  SEGUIR  LEYENDO 
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■  Si  la  matriz  A  es  estrictamente  diagonal  dominante,  entonces  ambos  métodos  convergen  para  cualquier 
elección  inicial  x^. 

■  Si  las  matrices  A  y  2 D  —  A  son  simétricas  definidas  positivas,  entonces  el  método  de  Jacobi  converge 
para  todo  x^°b 

■  Si  la  matriz  A  es  simétrica  definida  positiva,  entonces  el  método  de  Gauss-Seidel  converge  para  todo 
x<°>. 

Por  otro  lado,  la  sección  anterior  parece  indicar  que  el  método  de  Gauss-Seidel  es  superior  al  método 
de  Jacobi,  pero  no  existen  resultados  generales  que  muestren  que  el  método  de  Gauss-Seidel  converge  más 
rápido  que  el  de  Jacobi.  Esto  es  verdad  casi  siempre,  pero  hay  sistemas  lineales  para  los  que  el  método  de 
Jacobi  converge,  mientras  que  el  de  Gauss-Seidel  no.  En  algunos  casos  particulares  si  que  se  puede  dar  la 
superioridad  del  método  de  Gauss-Seidel  sobre  el  método  de  Jacobi,  como  se  establece  a  continuación: 

Si  la  matriz  A  es  tridiagonal  (matriz  con  elmentos  no  nulos  en  a  lo  sumo  la  diagonal  principal 
y  las  diagonales  inmediatamente  superior  e  inmediantemente  inferior),  no  singular  y  con  todos 
elementos  diagonales  distintos  de  cero,  entonces  los  métodos  de  Jacobi  y  Gauss-Seidel  son  ambos 
divergentes  o  son  ambos  convergentes.  En  el  último  caso,  los  radios  espectrales  de  las  matrices  T) 
y  Tg  verifican  que  p{Tj)2  =  p(Tg). 

Mejora  de  la  convergencia  mediante  relajación 

Podemos  modificar  el  método  de  Gauss-Seidel  introduciendo  un  parámetro  u>  que  permita  acelerar  la 
convergencia  del  método.  Después  de  calcular  cada  nuevo  valor  de  x,  mediante  el  método  de  Gauss-Seidel, 
modificamos  ese  valor  mediante  una  combinación  lineal  de  los  resultados  de  las  iteraciones  anterior  y  actual: 

(nuevo)  (nuevo)  ,  \  (anterior)  t  ■  i  n 

x¡  =u>x\  +  (1  —  lo)  x\  ,  para  cada  i  =  l,2,..,in. 

donde  u>  puede  tomar  valores  comprendidos  entre  0  y  2.  Para  0  <  lo  <  1,  se  llama  método  de  subrelajación 
sucesiva  y,  para  1  <  lo,  se  llama  método  de  sobrerelajación  sucesiva  (o  método  SOR,  del  inglés  successive 
over  relaxation).  Obsérvese  que  el  método  SOR  se  reduce  al  método  de  Gauss-Seidel  si  lo  =  1. 

Damos  a  continuación  algunas  propiedades  de  convergencia  a  priori  para  el  método  SOR: 

■  Si  la  matriz  A  es  simétrica  definida  positiva  y  0  <  w  <  2,  entonces  el  método  SOR  converge  para  todo 
x(°>. 

■  Si  la  matriz  A  es  estrictamente  diagonal  dominante  y  0  <  lo  <  1,  entonces  el  método  SOR  converge 
para  todo  x^°b 

Los  resultados  anteriores  tratan  la  convergencia  del  método  SOR,  pero  no  dicen  nada  acerca  de  la  elección 
del  parámetro  cu.  Con  relación  a  esto  último,  podemos  decir  que  se  puede  elegir  de  forma  óptima  el  parámetro 
lo  para  un  caso  particular  de  matrices: 

Si  la  matriz  A  es  simétrica  definida  positiva  y  tridiagonal,  entonces  el  valor  óptimo  del  parámetro 
lo  es 

2 

i+ v'i  ^p{T3y 

Notemos  que  las  matrices  tridiagonales  aparecen  frecuentemente  cuando  se  trabaja  con  métodos  de  iter- 
polación  mediante  splines  cúbicos  y  métodos  de  diferencias  finitas  para  resolver  problemas  de  contorno  y 
ecuaciones  en  derivadas  parciales. 

2.4.  Sugerencias  para  seguir  leyendo 

Los  tópicos  introducidos  en  este  capítulo  son  parte  del  campo  del  álgebra  lineal  numérica,  que  también 
incluye  los  tópicos  tratados  en  el  complemento  A.  Un  estudio  interesante  sobre  la  estrategia  de  pivoteo  se 
encuentra  en  Hager  (1998).  Una  discusión  sobre  el  escalado  en  el  pivoteo  y  el  cálculo  sobre  el  número  de 
operaciones  de  los  diferentes  métodos  puede  consultarse  en  Atkinson  (1989).  Dos  referencias  a  considerar 
para  la  resolución  de  sistemas  lineales  son  Wilkinson  (1994)  para  los  métodos  directos  y  Varga  (2000)  para 
los  métodos  iterativos.  Para  más  información  sobre  la  computación  matricial,  véase  Golub  y  Van  Loan  (1996). 
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2.5.  Ej  ercicios 


1.  Resuélvanse  los  siguientes  sistemas  por  el  método  de  eliminación  de  Gauss 


x  +  y  =  4 
2x  +  2z  =  4 
3y  +  3z  =  4 


0.15a:  +  2.11  y  +  30.75 z  =  -26.38 
b){  0.64a; +1.21y  +  2.05z=  1.01 
3.21a;  +  1.53y  +  1.042  =  5.23 


sin  pivoteo,  con  pivoteo  parcial  y  con  pivoteo  total. 

2.  Resuélvanse  los  sistemas  AjX.  =  b,  para  j  =  1,2,  con 


Ai  — 


1  1 
1  0 


Ao  — 


1 

0.01 


b  = 


100 

1 


¿Qué  se  puede  decir?  Calcúlese  el  vector  residual  r  =  Aj5t  —  b  y  el  vector  real  e  =  x  —  x,  para  j  =  1, 2, 
donde  x  denota  la  solución  calculada  y  x  la  solución  exacta. 


3.  Coste  operativo.  Una  forma  de  medir  la  eficiencia  del  método  de  eliminación  de  Gauss  es  contar  el 
número  de  operaciones  aritméticas  que  se  necesitan  para  resolver  un  sistema  lineal.  Por  convención,  se 
cuentan  solo  el  número  de  multiplicaciones  y  divisiones  porque  la  mayoría  de  los  ordenadores  realizan 
las  sumas  y  restas  de  forma  mucho  más  rápida.  Además,  el  número  de  multiplicaciones  y  divisiones 
se  cuentan  conjuntamente.  Demuéstrese  entonces  que  el  numero  total  de  multiplicaciones  y  divisiones 
necesarias  para  obtener  la  solución  de  un  sistema  lineal  de  orden  n  mediante  el  método  de  eliminación 
de  Gauss  es  ^ -  +  n2  —  ^ .  (Así  el  número  de  operaciones  aritméticas  necesarias  para  resolver  un  sistema 
lineal  por  el  método  de  eliminación  de  Gauss  es  aproximadamente  ;  es  decir,  de  orden  0(n3).) 

4.  El  método  de  Gauss-Jordan  es  una  variación  del  método  de  Gauss.  La  principal  diferencia  consiste  en 
que  cuando  se  elimina  una  incógnita,  se  elimina  de  todas  las  ecuaciones,  no  solo  de  las  subsiguientes. 
Entonces,  el  paso  de  elimación  genera  una  matriz  diagonal  en  vez  de  una  triangular.  En  consecuencia, 
no  es  necesario  utilizar  la  sustitución  regresiva  para  obtener  la  solución.  Ilústrese  dicho  método  con  los 
siguientes  sistemas: 

Í2x  +  y  —  z  =  1 

5x  +  2y  +  2z  =  —4  sin  utilizar  pivoteo, 

3a:  +  y  +  z  =  5 

!x  +  y  —  z  =  —3 

6a;  +  2y  +  2z  =  2  utilizando  pivoteo  parcial. 

—3a;  +  4y  +  z  =  1 


5. 


La  inversa  de  una  matriz  cuadrada  de  orden  n  se  puede  calcular  resolviendo  los  n  sistemas  de  ecuaciones 
Axj  =  ej,  con  j  =  1, 2, . . . , n,  y  donde  ej  es  el  vector  que  tiene  todas  las  componentes  ceros  excepto  la 
j-ésima  que  es  uno,  puesto  que  los  vectores  soluciones  X!,x2, . . .  ,xn  son  respectivamente  las  columnas 
1,  2, . . . ,  n  de  A-1.  Calcúlese,  utilizando  el  método  de  eliminación  de  Gauss  sin  pivoteo,  la  matriz  inversa 


de 


/  6  3  11  \ 

A=  3  2  7 

V  3  2  6  ) 


6. 


Muéstrese  que  la  factorización  LU  de  la  matriz  A  se  puede 
ejercicio  anterior  para  calcular  la  matriz  inversa.) 


utilizar  para  calcular  A  b  (Utilícese  el 


7.  Dadas  las  matrices 


/  1  2  3  4  \ 

1  4  9  16 

1  8  27  64 

\  1  16  81  256 


y 


B  = 


l1  1 

1  2 

0  1 

0  0 

\  0  o 


o  o  o  \ 
10  0 
3  10 
14  1 
0  15/ 


encuéntrense  sus  descomposiciones  LU.  ¿Se  puede  predecir  la  existencia  de  dichas  descomposiciones  sin 
necesidad  de  calcularla?  ¿Cómo  se  pueden  emplear  estas  descomposiciones  para  calcular  sus  inversas? 
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8.  Dada  la  matriz  tridiagonal  de  orden  n 


determínese  una  fórmula  general  para  An  =  LU,  donde  LU  es  la  factorización  de  Doolittle.  {Ayuda: 
estudiar  los  casos  n  =  3,4,5y  deducir  una  fórmula  general.) 

9.  Sean 


a)  Encuéntrese  la  factorización  de  Crout  de  A. 

b)  Resuélvase  el  sistema  Ax  =  b  a  partir  de  la  factorización  anterior. 
10.  Encuéntrense  las  factorizaciones  de  Cholesky  de  las  matrices 


13 

11 

11  \ 

(  2.25 

-3 

4.5 

11 

13 

11 

,  B=  | 

-3 

5 

-10 

11 

11 

13  / 

1  4.5 

-10 

34 

C  = 


15 

-18 

15 

-3 

-18 

24 

-18 

4 

15 

-18 

18 

-3 

-3 

4 

-3 

1 

11.  Sea  la  matriz  tridiagonal  de  orden  n 

a  1 

la  1 
1  a  1 


1  al 
1  a 

a)  Demuéstrese  que  An  es  simétrica  definida  positiva  para  a  >2. 

b)  Si  a  >  2,  encuéntrese  un  método  recurrente  para  hallar  la  factorización  de  Cholesky. 

12.  Discútase  la  convergencia  de  los  métodos  de  Jacobi  y  Gauss-Seidel  cuando  se  aplican  para  resolver  los 
siguientes  sistemas  lineales: 

(  2x  +  3z  =  1  (  x  +  2y  ~  2z  =  1  (  x  +  y  +  2z  =  1 

a)  <  Ay  +  2z  =  2  6)  <  x  +  y  +  z  =  1  c)<  x  +  3y  +  z  =  1 

[y  +  6z  =  3  y  2x  +  2y  +  z  =  1  y  y  +  Az  =  A 


Í2x  —  y  +  z  =  1  í  3x  +  y  +  z  =  4  (  8x  +  2y  +  2>z  =  51 

2x  +  2y  +  2z  =  1  e)  <  —2x  +  Ay  =  1  /)  <  2x  +  5y  +  z  =  23 

—x  —  y  +  2z  =  1  — x  +  2y  —  6z  =  2  y  —3x  +  y  +  6z  =  20 

A  continuación,  calcúlense,  partiendo  del  vector  cero,  las  soluciones  aproximadas  después  de  realizar 
tres  iteraciones. 

13.  Estudíese  la  convergencia  de  los  métodos  de  Jacobi  y  Gauss-Seidel  para  resolver  un  sistema  lineal  cuya 
matriz  de  coeficientes  es 

a  0  1  \ 

0  a  0  )  ,  aeR. 

10a/ 

Cuando  ambos  métodos  converjan  a  la  vez,  justifiqúese  cuál  lo  hace  más  rápido. 
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14.  Si  tenemos  que  resolver  un  sistema  lineal  en  el  que  la  matriz  de  coeficientes  es  diagonal  estrictamente 
domínate  y  tridiagonal  ¿convergen  los  métodos  de  Jacobi  y  Gauss-Seidel?  ¿cuál  lo  hará  de  forma  más 
rápida?  Razónense  las  respuestas. 


15.  Descríbase  el  valor  de  cada  componente  de  la  iteración  del  método  SOR  y  dése  la  forma  explícita 
de  la  correspondiente  matriz  de  iteración  para  cada  k  £  N.  Ilústrese  la  primera  iteración  del  método, 
utilizando  u)  =  1.2  y  empezando  con  el  vector  x-O  =  (0,0, 0)T,  para  resolver  el  sistema  lineal  Ax  =  b, 
donde 


16.  El  condicionamiento  de  una  matriz  A  se  define  mediante  el  número  de  condición  n(A)  =  ||2l||||A~1||, 
donde  ||  •  ||  es  una  norma  matricial,  y  cumple  que  n(A)  >  1.  En  general,  k(A )  depende  de  la  elección  de 
la  norma.  Si  k(A )  es  grande,  pequeños  cambios  en  el  sistema  provocan  grandes  cambios  en  la  solución, 
diciéndose  entonces  que  el  sistema  está  mal  condicionado.  Sean  los  sistemas  Ax  =  bj  con  i  =  1,2  y 


e  1  0  \ 

e  1  0 

0  0  1/ 


£  =  10"7. 


a)  Calcúlese  k(Á)  con  las  normas  1  e  infinito. 

b)  Resuélvanse  los  sistemas  y  coméntense  los  resultados. 


Capítulo  3 


Resolución  de  ecuaciones  no  lineales 


3.1.  Introducción 

Estudiamos  en  este  capítulo  uno  de  los  problemas  más  básicos  de  la  aproximación  numérica  y  con  mayor 
historia:  el  cálculo  de  raíces.  Es  decir,  la  determinación  de  una  raíz ,  o  solución,  de  una  ecuación  de  la  forma 
/(x)  =  0,  donde  /,  por  lo  general,  es  una  función  real  no  lineal  de  variables  reales.  Las  raíces  de  esta 
ecuación  también  se  llaman  ceros  de  la  función  /.  Un  ejemplo  que  muestra  la  necesidad  de  tener  técnicas 
de  aproximación  a  alguna  solución  del  problema  anterior  es  el  caso  simple  de  encontrar  soluciones  de  un 
polinomio.  Se  conocen  fórmulas  para  polinomios  de  grados  2,  3  y  4,  siendo  de  complejidad  creciente,  pero  con 
la  posibilidad  de  determinar  sus  ceros  exactamente.  A  principios  de  siglo  XIX  Galois  probó  que  no  existen 
fórmulas  explícitas  para  determinar  los  ceros  de  polinomios  de  grado  mayor  o  igual  que  5.  La  situación  es  aún 
más  difícil  cuando  /  no  es  un  polinomio.  Esta  limitación  obliga  a  buscar  métodos  para  encontrar  los  ceros  de 
forma  aproximada.  Los  métodos  que  se  discuten  en  esta  lección  son  iterativos  y  de  dos  tipos:  uno  en  el  que 
se  puede  asegurar  la  convergencia  y  el  otro  en  el  que  la  convergencia  depende  de  una  o  dos  aproximaciones 
iniciales. 

Métodos  conceptualmete  sencillos  son  los  métodos  de  intervalo,  que  aprovechan  el  cambio  de  signo  de  la 
función  en  el  entorno  de  una  raíz.  Así,  partiendo  de  dos  valores  proporcionados  inicialmente,  dichos  métodos 
tratan  de  reducir  el  tamaño  del  intervalo  que  encierra  al  cero  buscado,  hasta  converger  a  éste  con  la  suficiente 
precisión.  Un  ejemplo  de  este  tipo  de  métodos  es  el  de  bisección,  que  además  de  ser  un  método  simple  e 
intuitivo,  se  puede  utilizar  para  obtener  una  adecuada  estimación  inicial  del  cero  de  la  función  que  después 
puede  ser  refinado  por  métodos  más  poderosos. 

El  segundo  tipo  de  métodos  se  basa  en  aproximar  la  función,  cuyos  ceros  se  buscan,  por  una  recta.  Los 
métodos  que  describiremos  parten  de  una  aproximación  (método  de  Newton,  que  aproxima  la  función  por  una 
recta  tangente)  o  dos  aproximaciones  (método  de  la  secante,  que  aproxima  la  función  por  una  recta  secante) 
y  determinan  el  cero  de  la  función  con  una  precisión  deseada.  Estos  métodos  no  garantizan  la  convergencia, 
pero,  cuando  convergen,  lo  hacen  generalmente  más  rápidamente  que  los  métodos  de  intervalo  (¡5j). 


3.2.  El  método  de  bisección 

La  primera  y  más  elemental  técnica  que  consideramos  es  el  método  de  bisección,  que  está  basado  en  una 
propiedad  bien  conocida  de  las  funciones  continuas:  el  teorema  del  valor  medio.  Este  método  se  emplea  para 
determinar  una  raíz  de  f(x)  =  0  en  un  intervalo  [a,  b],  supuesto  que  /  es  continua  en  dicho  intervalo  y  que 
f(a)  y  f(b)  tienen  signos  distintos.  Aunque  el  método  funciona  en  el  caso  en  que  haya  más  de  una  raíz  en 
el  intervalo  [a,  6],  supondremos  por  simplicidad  que  la  raíz  es  única  y  la  llamaremos  a.  (En  el  caso  de  varias 
raíces,  habría  que  localizar  un  intervalo  que  contenga  sólo  una  de  ellas.) 

El  método  de  bisección  emplea  la  idea  anterior  de  la  siguiente  manera:  si  f(á)f(b)  <  0,  entonces  calculamos 
c  =  (a  +  b)/2  y  averiguamos  si  /(a)/(c)  <  0.  Si  lo  es,  entonces  /  tiene  un  cero  en  [a,c].  A  continuación 
renombramos  c  como  b  y  comenzamos  otra  vez  con  el  nuevo  intervalo  [a,  6],  cuya  longitud  es  igual  a  la  mitad 
del  intervalo  original.  Si  f{a)f(c)  >  0,  entonces  f{c)f(b)  <  0,  y  en  este  caso  renombramos  a  c  como  a.  En 
ambos  casos  se  ha  generado  un  nuevo  intervalo  que  contiene  un  cero  de  /,  y  el  proceso  de  partir  por  la  mitad 
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el  nuevo  intervalo  puede  repetirse  hasta  que  la  raíz  se  localiza  con  tanta  exactitud  como  se  quiera,  es  decir, 

I  Un  bn  |  ^  O 

donde  an  y  b.n  son  los  extremos  del  n-ésimo  intervalo  [an,bn\  y  e  es  una  tolerancia  especificada.  El  método 
de  bisección  también  se  conoce  como  método  de  bipartición.  Véase  la  figura  [3d| 

Algunos  otros  criterios  de  parada  diferentes  del  anterior  que  pueden  utilizarse  son: 

\an  —  bn\  i„,  \  i 

— ¡ — ¡ —  <e  o  \f(an)\  <  e. 


y 


Figura  3.1:  El  método  de  bisección  y  las  dos  primeras  aproximaciones  a  la  raíz  a. 

Ejemplo.  La  función  f(x)  =  x3  —  x2  —  1  tiene  exactamente  un  cero  en  [1, 2].  Vamos  a  aproximarlo  mediante 
el  método  de  bisección.  Como  /( 1)  =  — 1  <  0  y  /( 2)  =  3  >  0,  tenemos  que  /(l)/(2)  <  0.  Empezamos 
entonces  con  ao  =  1  y  í>o  =  2  para  calcular 

c0  =  a°  +  b°  =  ]-tl  =  1.5  y  /(c0)  =  /(1.5)  =  0.125. 

Ahora  /(1)/(1.5)  <  0,  luego  la  función  cambia  de  signo  en  [ao,Co]  =  [1,1-5].  Para  continuar,  tomamos 
entonces  ai  =  ao  y  b\  =  co,  de  manera  que 

ci  =  =  1.25  y  /(Cl)  =  /( 1.25)  =  -0.609375. 

De  nuevo  /(1.25)/(1.5)  <  0,  luego  la  función  cambia  de  signo  en  [1.25, 1.5].  Elegimos  ahora  =  Ci  y  &2  =  b\. 
Continuando  de  esta  manera,  se  puede  ver  en  m  que  hay  convergencia  a  la  raíz  a  =  1.465454  después  de 
doce  iteraciones  con  una  tolerancia  de  10-4.  □ 

Ya  hemos  indicado  anteriormente  que  es  importante,  para  un  método  que  proporciona  una  sucesión  de 
aproximaciones,  saber  si  la  sucesión  converge  y  en  cómo  de  rápido  lo  hace  en  dicho  caso. 

Para  una  sucesión  convergente,  dos  cantidades  describen  la  rapidez  con  que  la  sucesión  lo  hace:  el  orden  de 
convergencia  y  la  razón  de  convergencia.  Se  suele  decir  que  la  convergencia  es  lineal  si  el  orden  de  convergencia 
es  uno  y  cuadrática  si  es  dos. 

Una  forma  de  definir  la  convergencia  lineal,  que  es  particularmente  conveniente  para  el  método  de  bisec¬ 
ción,  es  que  la  razón  de  error  en  el  paso  n-ésimo  dividido  por  el  error  en  el  paso  (n  —  l)-ésimo  se  aproxima  a 
un  valor  constante  (la  razón  de  convergencia)  cuando  n  — >  00.  Aunque  no  sepamos  que  el  error  se  reduce  en 
1/2  en  cada  paso  del  método  de  bisección,  la  cota  del  error  se  reduce  en  1/2  y  el  límite  de  la  razón  de  error 
también  se  aproxima  a  1/2.  Entonces,  el  método  de  bisección  converge  linealmente  con  razón  1/2.  Damos 
a  continuación  un  resultado  sobre  la  convergencia  del  método, que  pone  de  manifiesto  lo  que  acabamos  de 
decir: 


Si  [ao,  60]  1  [ai,  61], . . . ,  [ara,  &„],...  denotan  los  intervalos  en  el  método  de  bisección,  entonces  los 
límites  líin„  an  y  lím„  bn  existen,  son  iguales  y  representan  un  cero  de  /.  Si  a  =  lím„  cn  y 
cn  =  (an  +  bn)/ 2,  entonces  |a  -  c„|  =  (b0  -  a0)/2n+1. 
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El  método  de  bisección  siempre  converge,  suponiendo  que  el  intervalo  con  el  que  se  comienza  dicho  método 
contenga  una  raíz,  y  es  fácil  de  programar,  comparado  con  otros  métodos,  aunque  su  velocidad  de  convergencia 
sea  lenta  por  ser  lineal. 

Comentario  adicional.  >  El  método  de  bisección  es  útil  para  dar  una  idea  rápida  de  la  localización 
de  las  raíces,  es  decir,  para  determinar  intervalos  de  longitud  pequeña  que  contengan  una  única  raíz; 
en  cambio,  al  ser  de  convergencia  muy  lenta,  los  cálculos  aumentan  considerablemente  si  deseamos  una 
buena  aproximación  de  la  raíz.  Esto  hace  que  este  método  se  aplique,  principalemente,  como  un  paso 
previo  a  la  utilización  de  otros  métodos  iterativos  de  convergencia  más  rápida. 


3.3.  El  método  de  Newton 


El  método  de  Newton  es  un  procedimiento  general  que  se  puede  aplicar  en  muy  diversas  situaciones. 
Cuando  se  emplea  para  localizar  los  ceros  de  una  función  real  de  variable  real  se  suele  llamar  método  de 
Newton- Raphson. 

La  idea  del  método  de  Newton  para  resolver  la  ecuación  f(x)  =  0  es  aproximar  la  función  /  por  su 
tangente  l  en  una  aproximación  de  la  raíz  a  y  resolver  la  ecuación  l(x)  =  0  (lo  que  se  denomina  linealización 
de  la  función).  Tomamos  esta  solución  como  nueva  estimación  de  la  raíz  de  f(x)  =  0  y  repetimos  el  proceso 
hasta  obtener  la  precisión  deseada. 

Sea  xq  la  estimación  inicial  de  la  solución.  Hallamos  la  tangente  a  la  gráfica  de  /  en  el  punto  (xo,  f{x o)) 
y  tomamos  la  intersección  X\  de  la  tangente  con  el  eje  de  las  x  como  nueva  estimación  de  la  solución.  Así,  la 
ecuación  de  la  recta  tangente  es 

V  =  f{x o)  +  f(x o)(x  -  x0) 

y  la  intersección  con  el  eje  de  las  x  se  obtiene  haciendo  y  =  0: 


X\  =  X  =  Xq  — 


f(x  o) 
f'{x  o) 


siempre  que  la  derivada  /'  no  se  anule  en  xq- 

Procediendo  de  forma  iterativa,  véase  la  figura  [372}  en  el  paso  n-ésimo  determinamos: 


^n+1  —  %n 


f(Xn) 

f'iXn)1 


n  =  0,1,2... 


V 


Figura  3.2:  El  método  de  Newton  y  las  dos  primeras  aproximaciones  a  la  raíz  a. 

En  teoría,  el  método  de  Newton  converge  a  la  raíz  a  sólo  después  de  un  número  infinito  de  iteraciones.  En 
la  práctica,  se  requiere  una  aproximación  de  a  hasta  una  tolerancia  especificada  e,  de  modo  que  las  iteraciones 
pueden  terminarse  si 


|^n+l  Xn\ 
|*£n+l  | 


<  e. 


\f{xn)\  <  e,  \xn+i  -  Xn\  <  e 


o 
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Ejemplo.  Utilicemos  el  método  de  Newton  para  aproximar  una  raíz  de  x3  —  x2  —  1  =  0  empezando  en  xq  =  1. 
Como  f'(x)  =  3x 2  —  2x,  tenemos  que  las  dos  primeras  iteraciones  de  Newton  son 

x1  =  x0-  f(x0)/f(x0)  =  1  -  (— 1)/1  =  2,  x2  =  x1  -  f{xi)/ f'(xi)  =  2  -  3/8  =  1.625. 

Continuando  de  esta  manera,  se  llega,  véase  m,  a  que  hay  convergencia  a  la  raíz  a  =  1.465571  después  de 
seis  iteraciones  con  una  tolerancia  de  10-4.  □ 


El  método  de  Newton  suele  proporcionar  resultados  precisos  en  unas  pocas  iteraciones.  Con  la  ayuda  del 
polinomio  de  Taylor  de  /  en  a  de  primer  orden  podremos  ver  por  qué.  Supongamos  que  a  es  la  solución 
de  f(x)  =  0  y  que  j"  existe  en  un  intervalo  en  el  que  están  tanto  a  como  xn.  Evaluando  x  =  a  la  fórmula 
correspondiente  al  primer  polinomio  de  Taylor  de  /  en  xn  obtenemos: 

0  =  /(<*)  =  /On)  +  f\xn)(a  -  xn)  +  ^/"( 0(«  -  xn)2, 
donde  £  está  entre  xn  y  a.  En  consecuencia,  si  f'(xn)  0,  tenemos 


a  -  xn  + 


f(Xn)  no 

f(xn)  2f'(xn) 


(o:  Xn) 


Y  como  xn+i  =  xn  —  'n\  ,  podemos  escribir 

f  (xn) 


Oí  In+l  —  2f(x  )  ^  Xn ^  ' 

Si  f(x)  0  en  un  intervalo  /  alrededor  de  a  y  xn  está  en  /,  entonces 

I f"(£)  I 

\a-xn+i\<—— — |ck  -  xn\2  <  K(a  -  xn)2,  donde  I< 

2  \f  (xn)\ 

El  rasgo  destacable  de  esta  desigualdad  es  que  el  error  \a  —  xn+\\  cometido  en  la  aproximación  (n+  l)-ésima 
está  acotado  por,  más  o  menos,  el  cuadrado  del  error  | a  —  xn  cometido  en  la  aproximación  n-ésima.  En  la 
práctica,  esto  quiere  decir  que  el  número  de  cifras  precisas  en  el  método  de  Newton  tiende,  aproximadamente, 
a  duplicarse  tras  cada  iteración,  lo  que  se  denomina  convergencia  cuadrática  u  orden  de  convergencia  dos. 

La  bondad  del  método  de  Newton  se  basa  en  la  hipótesis  de  que  la  derivada  de  /  no  se  anule  en  las 
aproximaciones  a  la  raíz  a.  Si  f  es  continua,  esto  significa  que  la  técnica  será  satisfactoria  siempre  que 
/'(a)  0  y  se  use  una  aproximación  inicial  lo  suficientemente  precisa.  La  condición  f(a)  ^  0  no  es  banal;  se 

verifica  precisamente  cuando  a  es  una  raíz  simple.  Cuando  la  raíz  no  es  simple,  el  método  de  Newton  puede 
ser  convergente,  pero  no  con  la  velocidad  indicada  anteriormente. 

El  método  de  Newton  es  una  técnica  poderosa,  pero  tiene  algunas  dificultades.  Una  de  ellas  es  que  si  el 
aproximación  inicial  xq  no  está  suficientemente  cerca  de  la  raíz  a,  el  método  puede  no  converger.  Tampoco 
se  debería  elegir  Xq  tal  que  f(x o)  sea  próximo  a  cero,  puesto  que  en  este  caso  la  tangente  es  casi  horizontal. 
La  convergencia  del  método  de  Newton  a  la  raíz  a  dependerá,  en  general,  de  la  elección  del  aproximación 
inicial  Xq. 

La  mayoría  de  las  veces  solo  sabemos  dar  resultados  de  convergencia  local,  que  solo  son  válidos  para  Xo 
perteneciendo  a  un  cierto  entorno  de  la  raíz  a.  Los  métodos  que  convergen  a  a  para  cualquier  elección  de  Xq 
perteneciente  a  un  intervalo  se  dicen  globalmente  convergentes  a  a. 

El  siguiente  resultado  de  convergencia  local  para  el  método  de  Newton  ilustra  la  importancia  de  la 
elección  de  la  aproximación  inicial. 

Sean  /,  f  y  f"  continuas  y  f  no  nula  en  algún  intervalo  abierto  que  contenga  a  una  raíz  simple 
a  de  f{x)  =  0.  Entonces,  existen  a  y  b,  con  a  <  a  <  b,  tales  que  el  método  de  Newton  converge  a 
a  para  cualquier  aproximación  inicial  Xq  £  (a,  b). 

Hay  situaciones  particulares  en  las  que  se  tiene  la  seguridad  de  que  el  método  de  Newton  converge  a  partir 
de  cualquier  aproximación  inicial  que  se  elija  (convergencia  global).  Como  muestra,  véase  [22],  damos  el 
siguiente  resultado  sobre  las  condiciones  suficientes  de  convergencia  del  método  de  Newton: 


1  máx  \f"(x)\ 

X£l 

2  mín  \  f{x)\  ' 

x£l 
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Sea  /  dos  veces  derivable  con  continuidad  en  un  intervalo  [a,  b]  y  tal  que: 

a)  f(a)f{b)  <  0, 

b)  f(x)  0,  Vx  €  l a,b ], 

c)  f"(x)  no  cambia  de  signo  en  [a,  b). 

Entonces,  existe  una  única  raíz  a  de  /( x)  =  0  en  [a,  b]  y  el  método  de  Newton  converge  a  a  para 
todo  aproximación  inicial  xq  €  [a,  b]  cumpliendo  que: 

i)  f(x0)f"(x0)  >  0,  o  bien, 

ii)  f(x0)f"(x0)  <  0  y  Xx  G  [a,  b}. 

Comentario  adicional.  >  Cuando  el  método  de  Newton  converge,  suele  hacerlo  de  forma  rápida.  Cuan¬ 
do  no  converge,  suele  ser  porque  la  aproximación  inicial  no  está  suficientemente  cerca  de  la  solución. 
Problemas  típicos  de  convergencia  suelen  aparecer  cuando  el  valor  de  f'{x)  está  próximo  a  cero  en  un 
entorno  de  la  solución,  donde  f(x)  =  0. 


3.4.  El  método  de  la  secante 


El  método  de  Newton  converge  muy  rápidamente,  pero  necesita  evaluar  la  derivada  de  la  función  en  cada 
paso  y  es  muy  sensible  a  la  estimación  inicial.  Para  superar  esta  dificultad  se  puede  reemplazar  f'(xn)  en  la 
expresión  del  método  de  Newton  por  el  cociente  de  diferencias: 

f,,„  ^  _  f(xn)  -  f(xn- 1) 

J  \%n)  ~ 

%n  %n—  1 


Esta  aproximación  tiene  su  origen  en  la  definición  de  f  en  términos  de  un  límite: 

/'(x)  =  lím 

X  —  U 

Cuando  se  realiza  esta  sustitución,  el  algoritmo  resultante  se  conoce  como  método  de  la  secante  y  su  expresión 
es: 


dados  a;_i,  x0;  xn+1  =xn-  f(xn) 


n  =  0,1,2... 


J(xn)  ~  f{xn-i)J  : 

Ya  que  el  cálculo  de  xn+i  requiere  conocer  xn  y  xn_i,  se  deben  dar  al  principio  los  valores  de  dos  apro¬ 
ximaciones  iniciales  (véase  la  figura  3.3 1.  Sin  embargo,  cada  xn+i  requiere  sólo  una  nueva  evaluación  de  /. 


Figura  3.3:  El  método  de  la  secante  y  la  primera  aproximación  a  la  raíz  a. 

Un  criterio  adecuado  de  parada  es 

\f(xn)\  <  e,  |xn+i  -  xn\  <  e  o  ^”+1 — <  e, 

\Xn+l\ 


donde  e  es  una  tolerancia  especificada. 
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Ejemplo.  Utilizamos  ahora  el  método  de  la  secante  con  xq  =  1  y  X\  =  2  para  aproximar  la  raíz  real  de 
x3  —  x2  —  1  =  0.  Como  /( 1)  =  —1  y  /( 2)  =  3,  la  primera  aproximación  a  la  raíz  es: 

12  =  “ fln)  (/M-/w) =  2  - 3  iUFI)  =  L25- 

Ahora  f(x 2)  =  /(1.25)  =  —0.609375  y  la  siguiente  aproximación  es: 

=  12  -  /(I2>  =  L25  -  (~°- 6093751  -0.6093752-  3  =  L37“23' 

Continuando  de  esta  manera,  se  llega,  véase  m,  a  que  hay  convergencia  a  la  raíz  a  =  1.465571  después  de 
siete  iteraciones  con  una  tolerancia  de  10-4.  □ 

La  interpretación  geométrica  del  método  de  la  secante  es  similar  a  la  del  método  de  Newton,  puesto  que 
ahora  la  recta  tangente  a  la  curva  se  reemplaza  por  una  recta  secante. 

El  método  de  la  secante  tiene  las  ventajas  de  no  utilizar  la  derivada  y  ser  más  robusto  que  el  de  Newton. 
En  cambio,  es  más  lento  que  este  último,  pero  más  rápido  que  el  de  bisección,  lo  que  puede  verse  en  el 
siguiente  resultado  de  convergencia  local: 

Sean  /,  f  y  f"  continuas  y  f  no  nula  en  algún  intervalo  abierto  que  contenga  a  una  raíz 
simple  a  de  f(x)  =  0.  Entonces,  existen  a  y  b,  con  a  <  a  <  b1  tales  que,  para  cualesquier 
aproximaciones  iniciales  X-±,xo  £  (a,b),  el  método  de  la  secante  converge  a  a  con  orden  de 
convergencia  \  (l  +  \/5)  ~  1.618. 


3.5.  El  método  de  Newton  para  sistemas  de  ecuaciones  no  lineales 

El  método  de  Newton  para  sistemas  de  ecuaciones  no  lineales  es  una  extensión  del  método  utilizado  para 
resolver  una  sola  ecuación,  por  tanto  sigue  la  misma  estrategia  que  se  empleó  en  el  caso  de  una  sola  ecuación: 
linealizar  y  resolver,  repitiendo  los  pasos  con  la  frecuencia  necesaria.  Consideramos,  por  sencillez,  el  caso  de 
dos  ecuaciones  con  dos  variables: 

í  f{xi  y)  =  o, 

\g(x,y)  =  0. 

Si  definimos  la  función  F(x,y)  =  (f(x,y),g(x,y)),  transformamos  el  sistema  anterior  en 

F(x,y)  =  0. 


Podemos  realizar  entonces  una  formulación  idéntica  al  caso  de  una  variable  donde  la  derivada  está  dada  en 
este  caso  por  la  matriz  jacobiana 


F'(x,  y) 


'df ,  , 

di(x’y) 


¡>s 

v dx 


O  ,y) 


d¿ 

dy 


Así,  el  método  de  Newton  comienza  por  un  vector  inicial  (xo,j/o)T  y  calcula  el  resto  de  aproximaciones 
mediante 

(?+1)  =  -(F'ix^ynV-'Fix^yJ, 

\£/n+l/  \i/n  / 

donde  (F'(xn,  y-n))1  es  la  matriz  inversa  de  F'(xn,yn).  Para  poder  aplicar  este  método  es  necesario  que 
F'(x,y)  sea  no  singular. 

Un  problema  del  método  anterior  es  que  el  cálculo  de  la  matriz  inversa  es  costoso  computacionalmente  y 
debemos  calcularla  en  cada  paso.  Esto  se  puede  resolver  descomponiendo  el  método  en  dos  etapas: 


1.  Resolver  el  sistema  lineal  con  dos  ecuaciones  y  dos  incógnitas: 


A1  ( xn ,  yn ) 


F^Xn ; yn )  • 
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2.  Tomar  como  nueva  aproximación: 


í  zn+l\  =  í 

\yn+ 1)  \yn)  \Vn) 


El  sistema  lineal  de  la  etapa  1  se  puede  resolver  por  cualquiera  de  los  métodos  vistos  en  el  capítulo  dedicado  a 
la  resolución  de  sistemas  lineales,  y  puede  resultar  difícil  de  resolver  cuando  la  matriz  F' (x,  y)  es  casi  singular. 

Ejemplo.  Apliquemos  el  método  de  Newton  para  aproximar  una  solución  del  sistema  no  lineal  dado  por 

í  f(x,  y)  =  x3  +  3 y2  -21=0 
I  g(x,  y)  =  X2  +  2y  +  2  =  0 


utilizando  la  aproximación  inicial  (¡eq,  yo)T  =  (1;  —  1)T-  La  matriz  jacobiana  es 


F'(x,  y) 


(  3a:2  6  y\ 

\  2x  2  J 


En  el  punto  (1,-1)  el  vector  función  y  la  matriz  jacobiana  tienen  los  valores 


F(  1,-1) 


y  ^(1,-1) 


Hacemos  ahora  la  primera  etapa: 

i  -/)(:) -(T) 


/u0\  _  (  1.555556  \ 
V^o/  “  y— 2.055560 J  ' 


La  nueva  aproximación  es  entonces  (segunda  etapa) : 


( xi\  ( X0\  fu0\  (  1  \  /  1.555556  \ 
\Vi  J  W  V’o )  K-1)  2.055560 ) 


(  2.555556  \ 
y — 3.055560 J  ' 


Iteramos  el  proceso  hasta  que  ||(,uti,í;7i)||00  =  máx{|un|,  |un|}  <  10  6,  de  manera  que  en  la  sexta  iteración 
obtenemos  la  solución  aproximada  (1.643038,  — 2.349787)T.  Véase  [IB].  □ 

Como  en  el  método  de  Newton  para  una  ecuación,  la  convergencia  no  está  garantizada.  Probablemente, 
el  método  de  Newton  para  sistemas  de  ecuaciones  no  lineales  convergerá  si  se  dan  las  siguientes  condiciones 

my- 

a)  Las  funciones  /  y  g  y  sus  derivadas  deben  ser  continuas  y  acotadas  cerca  de  la  solución, 

b)  el  determinante  de  la  matriz  jacobiana,  llamado  jacobiano,  debe  ser  distinto  de  cero  cerca  de  la  solución, 

c)  las  aproximaciones  iniciales  de  la  solución  deben  estar  suficientemente  cerca  de  la  solución. 

Cuando  el  método  de  Newton  converge,  suele  hacerlo  de  forma  rápida.  Cuando  no  converge,  suele  ser 
porque  las  aproximaciones  iniciales  no  están  suficientemente  cerca  de  la  solución.  Problemas  típicos  de  con¬ 
vergencia  suelen  aparecer  cuando  el  valor  del  jacobiano  está  próximo  a  cero  en  un  entorno  de  la  solución, 
donde  F(x,  y)  =  0. 

Nota.  El  método  de  Newton  es  fácilmente  generalizable  al  caso  de  sistemas  de  m  ecuaciones  no  lineales  con 
m  >  2.  Un  desarrollo  del  mismo  puede  consultarse  en  m- 


3.6.  Sugerencias  para  seguir  leyendo 

Para  información  adicional  sobre  las  técnicas  del  cálculo  de  raíces  se  recomienda  Atkinson  (1989)  y  Ralston 
y  Rabinowitz  (2001).  Para  sistemas  de  ecuaciones  no  lineales  pueden  consultarse  [TQ,  Ortega  y  Reinboldt 
(2000)  y  Stoer  y  Bulirsch  (2002). 
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3.7.  Ejercicios 

1.  a)  Si  /  es  una  función  continua  en  un  intervalo  [a,  b]  en  el  que  f(a)f(b)  <  0,  demuéstrese  que  el  método 

de  bisección  aproxima  un  cero  de  /  con  un  error  en  el  paso  n-ésimo  de  a  lo  sumo  ( b  —  a)/2n+1. 

b)  Determíniese  entonces  el  número  de  iteraciones  que  requiere  el  método  de  bisección  para  encontrar 
el  único  cero  de  f(x)  =  x3  —  x2  —  1  en  el  intervalo  [1,  2]  con  un  error  absoluto  de  no  más  de  10~6. 

2.  Supongamos  que  el  método  de  bisección  se  inicia  en  el  intervalo  [50,63].  ¿Cuántos  pasos  deben  darse 
para  calcular  una  raíz  con  una  precisión  de  10~7 8 * * * 12? 

3.  Para  f(x)  =  2x3  —  x2  +  x  —  1  se  tiene  que  /(— 4)/(4)  <  0  y  /(0)/(l)  <  0,  así  que  el  método  de  bisección 
se  puede  aplicar  tanto  en  [—4, 4]  como  en  [0, 1].  Pero  ¿en  cuál  de  los  dos  intervalos  interesa  más  empezar 
el  método?  ¿Por  qué?  Justifiqúense  las  respuestas. 

4.  El  método  de  la  falsa  posición  (regula  falsi).  Un  inconveniente  del  método  de  bisección  es  que  al  dividir 
los  intervalos  [a,  b]  en  mitades  iguales  no  se  tienen  en  cuenta  las  magnitudes  de  f(a)  y  f(b).  Por  ejemplo, 
si  /(a)  está  mucho  más  cerca  del  cero  que  /(&),  parece  lógico  que  la  raíz  de  la  ecuación  f(x)  =  0  esté  más 
cerca  de  a  que  de  b.  Un  método  alternativo  que  aprovecha  esta  mejora  es  el  método  de  la  falsa  posición 
y  consiste  en  unir  /(a)  y  f(b)  mediante  una  recta,  de  manera  que  la  intersección  de  esta  recta  con  el 
eje  de  las  x  suele  dar  una  mejor  aproximación  de  la  raíz.  (El  nombre  de  falsa  posición  (en  latín,  regula 
falsi)  viene  del  hecho  de  que  al  reemplazar  la  función  por  una  recta,  obtenemos  una  «falsa  posición»  de 
la  raíz.) 

a)  Dése  la  fórmula  de  la  aproximación  de  la  raíz  que  se  obtiene  en  cada  paso  por  este  método. 

b)  Aproxímese,  mediante  este  método  y  una  tolerancia  de  1CU4,  la  única  raíz  de  x3  —  x2  —  1  =  0  que 
está  en  el  intervalo  [1,2]. 

5.  a)  Para  calcular  el  inverso  de  un  número  a,  sin  tener  que  realizar  divisiones  o  exponenciaciones, 

podemos  hallar  un  cero  de  la  función  f(x)  =  f  —  a  mediante  el  método  de  Newton.  Determínense, 
para  a  >  0,  aproximaciones  iniciales  para  las  que  el  método  converge. 

b)  Indíquese  qué  función  se  utilizaría  en  el  método  de  Newton  para  calcular  é¡/a,  con  a  >  0,  y 
determínense  aproximaciones  iniciales  para  las  que  el  método  converge.  Repítase  lo  mismo  para 
\fa- 

6.  El  polinomio  p(x)  =  x3  +  94x2  —  389cc  +  294  se  anula  para  x  =  l,  x  =  3yx  =  —98.  El  punto  Xo  =  2 
parece  un  buena  aproximación  inicial  para  aproximar  cualquiera  de  los  dos  primeros  ceros  del  polinomio 
mediante  el  método  de  Newton.  Apliqúese  el  método  de  Newton  a  partir  de  Xo  =  2.  ¿Qué  sucede  a 
partir  de  la  segunda  iteración?  Trátese  de  determinar  tres  aproximaciones  iniciales  que  lleven  a  cada 
una  de  las  soluciones. 

7.  Para  determinar  la  posición  de  un  astro  o  un  satélite  en  el  espacio  es  necesario  resolver  la  ecuación  de 
Kepler ,  que  está  dada  por  M  =  E  —  e  sen  E,  donde  M  ye  son  constantes  conocidas.  Tomando  M  =  2, 
determínese  si  converge  el  método  de  Newton  en  los  siguientes  casos: 

a)  e  =  1/2  y  Xq  €  (a,  7r),  donde  a  es  la  raíz  de  la  ecuación  de  Kepler, 

b)  e  =  1/2  y  x0  =  n/2, 

c)  e  =  2  y  i'o  £  (a,  n),  donde  a  es  la  raíz  de  la  ecuación  de  Kepler, 

d)  e  =  2  y  a’o  =  37t/4, 

e)  e  =  2  y  xq  =  7r/2. 

8.  Sea  la  ecuación  x3  —  3x2  +  x  +  3  =  0. 

a)  Demuéstrese  que  la  ecuación  tiene  una  única  solución  en  el  intervalo  [—1,0]. 

b )  Calcúlense  tres  iteraciones  del  método  de  Newton  utilizando  como  aproximación  inicial  xo  =  1. 
¿Qué  se  puede  decir? 

c)  Aproxímese,  mediante  tres  iteraciones  del  método  de  Newton,  la  única  solución  de  la  ecuación  en  el 

intervalo  [—1,0],  utilizando  una  aproximación  inicial  a  partir  de  la  cual  se  garantice  la  convergencia 
del  método  de  Newton  a  la  solución.  Justifiqúese  la  elección  de  la  aproximación  inicial. 
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9.  Raíces  complejas  de  ecuaciones.  También  podemos  utilizar  el  método  de  Newton  para  calcular  las  raíces 
complejas  de  una  ecuación  f(z)  =  0,  donde  z  =  x  +  iy  es  un  número  complejo,  mediante 


^n+ 1  —  Zn 


f(zn) 

f'(Zn)7 


71  =  0,1,2... 


Para  ello  debemos  dar  un  número  complejo  como  aproximación  inicial  Zq  para  el  método  de  Newton. 
El  correspondiente  error  se  puede  estimar  a  partir  de  E  =  \/Re(7(;)2  +  Im(u;)2,  donde  w  =  "  — p— 

\zn\ 

y  Re(iu)  e  Im(?x)  son  respectivamente  las  partes  real  e  imaginaria  de  w.  Utilícese  el  método  de  Newton 
para  encontrar  una  raíz  compleja  de  la  ecuación  f(z)  =  z2  —  z  +  4  =  0  y  calcúlese  el  error. 


10.  El  método  de  Newton  modificado.  El  método  de  Newton  pierde  su  convergencia  cuadrática  en  el  caso 
de  raíces  repetidas,  pasando  a  tener  solo  convergencia  lineal.  Sin  embargo,  si  se  conoce  la  multiplicidad 
de  la  raíz  (o  se  puede  estimar),  es  posible,  para  preservar  la  velocidad  de  convergencia,  modificar  el 
método  de  la  siguiente  forma: 


•^n+l  — 


—  m 


f{Xn) 


n  =  0, 1, 2  , 


donde  m  es  la  multiplicidad  de  la  raíz  buscada.  Este  método  se  llama  método  de  Newton  modificado. 
Verifiqúese  lo  anterior,  comparando  los  resultados,  cuando  se  aproxima  la  raíz  doble  más  cercana  a  1 
de  la  ecuación  x3  —  2ir2  —  0.75a;  +  2.25  =  0  mediante  los  métodos  de  Newton  y  Newton  modificado. 


11. 


Aceleración  de  la  convergencia.  Una  aspecto  interesante  a  la  hora  de  aplicar  un  método  iterativo  es  la 
posibilidad  de  acelerar  su  convergencia  (siempre  que  sea  posible).  Por  ejemplo,  el  método  de  Newton 
tiene  convergencia  lineal  cuando  aproxima  raíces  múltiples,  salvo  que  modifiquemos  el  método  con¬ 
venientemente  (ejercicio  anterior),  aunque  esta  modificación  requiera  del  conocimiento  previo  de  la 
multiplicidad  de  la  raíz.  El  método  A2  de  Ait.ken  es  una  técnica  que  permite  acelerar  la  convergencia  de 
una  sucesión  que  converge  linealmente,  independientemente  de  su  origen  o  ámbito  de  aplicación.  Así,  si 

(x  1  _  Xrjf 

la  sucesión  de  aproximaciones  {x„}  converge  linealmente  a  a  y  definimos  yn  =  xn - — - — - , 

xn+ 2  -  2xn+i  +  xn 

para  todo  n  >  0,  entonces  la  sucesión  { yn }  también  converge  a  a  y,  en  general,  más  rápidamente.  (En 
[7j  puede  verse  la  dedución  de  la  sucesión  {yn}-)  Verifiqúese  lo  anterior  para  la  sucesión  {xn}  dada  por 


xn  =  eos 


,  para  todo  n  >  1. 


12.  Reración  de  punto  fijo.  El  método  de  Newton  es  un  ejemplo  de  método  iterativo  que  calcula  una 
sucesión  de  aproximaciones  mediante  una  fórmula  del  tipo  xn+i  =  g{xn),  para  todo  n  >  0.  Un  método 
así  definido  se  llama  iteración  de  punto  fijo.  Para  el  método  de  Newton  la  función  g  es  g{x)  =  x  — 
Obsérvese  que  aproximar  las  raíces  de  /(x)  =  0  es  equivalente  a  aproximar  las  raíces  de  g( x)  =  x,  que 
son  los  puntos  fijos  de  g. 


a)  Interprétese  geométricamente  este  método. 

b)  Sea  g  :  I  — >  /,  donde  I  es  un  subconjunto  cerrado  de  R,  tal  que  | g(x)  —  g(y)\  <  L\x  —  y\  y  L  <  1. 
Demuéstrese  que  existe  una  única  raíz  de  la  ecuación  g(x)  =  x  que  se  puede  obtener  como  límite 
de  la  sucesión  {x„+i  =  g(xn)},  para  todo  n  >  0,  a  partir  de  cualquier  aproximación  inicial  xq  €  /. 

c)  Si  aplicamos  la  iteración  de  punto  fijo  a  la  función  g[x)  =  2  +  (a;  —  2)4  empezando  en  Xq  =  2.5, 
encuéntrese  el  intervalo  I  de  aproximaciones  iniciales  para  el  que  el  método  converge. 

13.  Si  se  utiliza  el  método  de  la  secante  para  encontrar  los  ceros  de  f(x)  =  x3  —  3x2  +  2x  —  6  =  0  con  xq  =  1 
y  x\  =  2,  ¿cuál  es  X2? 

14.  Sean  las  ecuaciones  x4  —  x—  10  =  0yx-e_I  =  0.  Determínense  las  aproximaciones  iniciales  y  utilícense 
para  encontrar  las  aproximaciones  a  las  raíces  con  cuatro  cifras  decimales  mediante  el  método  de  la 
secante. 
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15.  Realícense  tres  iteraciones  del  método  de  Newton  en  dos  variables  para  aproximar  las  soluciones  de  los 
sistemas 

s  í  x  =  sen(:r  +  y)  , ,  í  4x2  —  y2  =  0  ,  í  xy 2  +  x2y  +  x4  =  3 

ü  \  y  =  cos(x  —  y).  \  4 xy2  —  x  =  1  C  a;3y5  —  2a;5y  —  x2  =  —  2 

partiendo  de  los  puntos  (1,1),  (0,1)  y  (2,2)  respectivamente. 

16.  Verifiqúese  que  (1,1)  y  (-1,-1)  son  soluciones  del  sistema  no  lineal 

(  x2  +  y2  —  2  =  0 
\  xy  —  1  =  0. 

Expliqúense  las  dificultades  que  tiene  el  método  de  Newton  para  hallar  dichas  soluciones. 


Capítulo  4 


Aproximación  de  funciones  y  datos 


4.1.  Introducción 

La  necesidad  de  aproximar  funciones  y  datos  se  presenta  en  muchas  ramas  de  la  ingeniería  y  las  ciencias.  El 
concepto  de  aproximación  se  basa  en  reemplazar  una  función  /  por  otra  más  simple,  /,  que  podamos  utilizar 
como  sustituto.  Como  veremos  en  el  siguiente  capítulo,  esta  técnica  se  utiliza  frecuentemente  en  integración 
numérica,  donde,  en  lugar  de  calcular  f(x)  dx7  calculamos  de  forma  exacta  J Qb  f(x)  dx7  donde  /  es  una 
función  fácil  de  integrar  (por  ejemplo,  un  polinomio).  También  puede  ocurrir  que  solo  se  conozca  la  función 
/  parcialmente  por  medio  de  valores  en  alguna  colección  finita  de  datos.  En  estos  casos  construiremos  una 
función  continua  /  que  represente  a  la  colección  de  datos.  En  m  se  muestran  varios  ejemplos. 

Sabemos  que  una  función  /  se  puede  reemplazar  por  un  polinomio  de  Taylor  en  un  intervalo  dado. 
Computacionalmente,  esta  sustitución  es  costosa  porque  requiere  del  conocimiento  de  /  y  sus  derivadas 
hasta  el  orden  n  (el  grado  del  polinomio)  en  un  punto  Xq.  Además,  el  polinomio  de  Taylor  puede  fallar  para 
representar  a  /  suficientemente  lejos  del  punto  Xq,  como  podemos  ver  en  el  siguiente  ejemplo.  En  la  figura |4~T] 
se  compara  el  comportamiento  de  f(x)  =  1/x  con  el  de  su  polinomio  de  Taylor  de  grado  10  construido 
alrededor  del  punto  xq  =  1:  Pio(:r)  =  2  —  x  +  (a;  —  l)2  —  (x  —  l)3  +  (x  —  l)4  —  (x  —  l)5  +  (x  —  l)6  —  (x  —  l)7  + 
(x  —  l)8  —  (x  —  l)9  +  (x  —  l)10.  La  afinidad  entre  la  función  y  su  polinomio  de  Taylor  es  muy  buena  en  un 
pequeño  entorno  de  xq  =  1,  mientras  que  resulta  insatisfactoria  cuando  x  —  Xq  se  hace  grande  023]). 


Figura  4.1:  Comparación  entre  la  función  f(x)  =  1/x  (línea  continua)  y  su  polinomio  de  Taylor  de  grado  10 
alrededor  del  punto  Xq  =  1  (línea  discontinua) . 

Puesto  que  los  polinomios  de  Taylor  tienen  la  propiedad  de  que  toda  información  que  se  utiliza  está 
centrada  en  un  único  punto  Xq7  es  común  que  estos  polinomios  den  aproximaciones  poco  precisas  a  medida 
que  nos  vamos  alejando  de  Xo,  lo  que  limita  la  utilización  de  aproximaciones  mediante  polinomios  de  Taylor 
a  situaciones  en  las  que  éstas  sean  necesarias  únicamente  en  puntos  cercanos  a  Xo .  Para  realizar  cálculos 
ordinarios  resulta  más  eficaz  utilizar  métodos  que  empleen  la  información  disponible  en  varios  puntos.  A  lo 
largo  de  este  capítulo  introducimos  métodos  de  aproximación  que  se  basan  en  enfoques  alternativos.  El  uso 
primordial  de  los  polinomios  de  Taylor  en  análisis  numérico  no  es  para  generar  aproximaciones,  sino  para 
construir  técnicas  numéricas. 


39 


40 


CAPÍTULO  4.  APROXIMACIÓN  DE  FUNCIONES  Y  DATOS 


El  estudio  de  la  teoría  de  aproximación  implica  dos  tipos  de  problemas.  Un  problema  surge  cuando  se  tiene 
explícitamente  una  función  pero  se  desea  encontrar  un  tipo  de  «función  más  simple»,  como  un  polinomio, 
que  se  pueda  usar  para  determinar  los  valores  aproximados  a  la  función  dada.  El  otro  problema  consiste 
en  ajustar  funciones  a  datos  dados  y  encontrar  qué  función,  dentro  de  una  cierta  clase,  es  la  que  «mejor» 
representa  los  datos.  Estudiaremos  ambos  problemas  en  este  capítulo. 

4.2.  Interpolación 

En  una  gran  variedad  de  problemas  es  deseable  representar  una  función  a  partir  del  conocimiento  de 
su  comportamiento  en  un  conjunto  discreto  de  puntos.  En  algunos  problemas  solo  tendremos  valores  en  un 
conjunto  de  datos,  mientras  que  en  otros,  buscaremos  representar  una  función  mediante  otra  más  simple. 
En  el  primer  caso  hablaremos  de  interpolación  de  datos ,  y  en  le  segundo  de  interpolación  de  funciones.  En 
ambos  casos  el  objetivo  es  obtener  estimaciones  de  la  función  en  puntos  intermedios,  aproximar  la  derivada 
o  la  integral  de  la  función  en  cuestión  o,  simplemente,  obtener  una  representación  continua  o  suave  de  las 
variables  del  problema. 

La  interpolación  es  el  proceso  de  determinar  una  función  que  represente  exactamente  una  colección  de 
datos.  El  problema  de  interpolación  se  puede  formular,  en  general,  en  los  siguientes  términos:  sean  (a;*,/,;), 
i  =  0, 1, . . . ,  n,  pares  de  valores  reales  dados  de  manera  que  x¿  yf  xv  i  yf  j,  ¿existe  alguna  función  /,  de 
tipo  predeterminado,  tal  que  /(a;*)  =  /¿,  para  todo  i  =  0,1,..., n?  Los  puntos  Xi  se  llaman  nodos  y  la 
tal  función  /  se  llama  función  de  interpolación  del  conjunto  de  datos  {/¿ ;  i  =  0,1, . . .  ,n}.  En  caso  de  que 
los  {/,:}  representen  los  valores  alcanzados  por  una  función  continua  /,  entonces  /  se  denomina  función  de 
interpolación  de  /. 

Dependiendo  del  tipo  de  funciones  de  interpolación  que  se  consideren,  se  distinguen  varios  tipos  de  inter¬ 
polación,  entre  los  que  se  pueden  citar:  polinómica,  trigonométrica,  spline  (interpolación  polinomial  a  trozos), 
racional  y  exponencial.  El  tipo  más  elemental  de  interpolación  consiste  en  ajustar  un  polinomio  a  una  colec¬ 
ción  de  datos,  que  se  conoce  como  interpolación  polinómica.  Los  polinomios  tienen  derivadas  e  integrales  que 
son  polinomios,  así  que  son  una  elección  natural  para  aproximar  derivadas  e  integrales.  Por  simplicidad,  solo 
vamos  a  considerar  la  interpolación  polinómica  de  Lagrange  y  la  interpolación  mediante  funciones  splines. 

4.2.1.  Interpolación  polinómica  de  Lagrange 

Centrémonos  en  la  interpolación  polinómica  de  Lagrange.  Dada  una  tabla  de  n  +  1  puntos  (t¿,  /,),  i  = 
0, 1, . . . ,  n,  con  Xi  yf  Xj,  i  yf  j,  llamamos  interpolación  polinómica  a  la  determinación  de  un  polinomio  pn  de 
grado  <  n  y  tal  que 

Pn{Xi)  =  fi ,  *  =  0,  l,...,n. 

El  polinomio  pn  recibe  el  nombre  de  polinomio  de  interpolación  de  los  valores  /¿  en  los  nodos  a Cuando  ft 
sea  el  valor  de  una  función  /  en  Xi,  i  =  0, 1, . . . ,  n,  hablaremos  de  interpolación  polinómica  de  la  función  / 
en  los  nodos  a pn  se  llama  entonces  polinomio  de  interpolación  de  /  y  se  suele  denotar  por  pnf. 

Existencia  y  unicidad  del  polinomio  de  interpolación 

La  existencia  y  unicidad  del  polinomio  anterior  de  interpolación  pn  se  sigue  a  partir  del  método  de  los 
coeficientes  indeterminados  para  calcular  los  coeficientes  de  pn.  Así,  buscamos  un  polinomio  pn  de  grado 
n  tal  que,  para  Xo  <  Xi  <  ■  ■  ■  <  xn  y  /o,  /i, . . . ,  fn,  se  cumpla: 

Pn(xi)  =  fi ,  para  todo  i  =  0, 1, . . . ,  n. 

La  manera  aparentemente  más  simple  de  resolver  el  problema  es  escribir: 

Pn{x)  =  a0  +  a\X  +  a2x2  +  ■  ■  ■  +  anxn, 


donde  (i  =  0, 1, . . . ,  n)  son  incógnitas  a  determinar  mediante  las  relaciones: 


fi  =  Pn{xi)  =  a0  +  aiXi  +  a2x2  H - 1-  a„;r", 


i  =  0, 1, . . . ,  n. 
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Six=  (a0,a1,...,an)T,  b=  y 

/I  Xq  xl  ...  x£\ 
1  X\  x\  ...  X 1 


\1  Xn  Xn  ■■■  XnJ 

las  relaciones  anteriores  se  pueden  escribir  como  el  sistema  lineal 


Tx  =  b. 


La  matriz  T  se  denomina  matriz  de  Vandermonde  asociada  a  los  nodos  xo,  X\, . . . ,  xn  y  su  determinante 
es  no  nulo  (por  ser  los  puntos  Xi  distintos),  por  lo  que  el  problema  se  reduce  a  resolver  un  sistema  lineal  de 
n  +  1  ecuaciones  con  n  +  1  incógnitas  con  solución  única. 


Ejemplo.  Calculemos  el  polinomio  que  interpola  la  siguiente  tabla  de  datos: 


X 

0 

7t/2 

f 

0 

1 

Como  hay  dos  datos,  el  polinomio  es  lineal  de  la  forma  p\  (a;)  =  cto  +  aiX.  Si  aplicamos  la  condición 
(¿  =  1,2),  obtenemos  el  sistema 


í  a0  =  0 

\  o-o  +  §  ai  =  1 


fi 


cuya  solución  es  cío  =  0  y  ai  =  Por  lo  tanto,  pi{x)  =  ^ x .  Si  los  datos  de  la  tabla  corresponden  a  la  función 
f{x)  =  sena;,  vemos  en  la  figura  4.2  la  aproximación  de  f(x)  mediante  el  polinomio  pi(x).  □ 


Figura  4.2:  Función  y  =  sena:  (línea  continua)  y  su  polinomio  de  interpolación  y  =  p\{x)  =  2 x  en  los  nodos 
x0  =  0  y  a;i  =  f  (recta  discontinua). 


Comentarios  adicionales.  >  Es  importante  reseñar  que  si  interpolamos  una  función  /  en  n+1  puntos 
distintos,  podemos  obtener  que  el  grado  del  polinomio  de  interpolación  pn  sea  distinto  de  n.  De  hecho, 
aunque  n  sea  grande,  el  grado  del  polinomio  puede  ser  pequeño.  Por  ejemplo,  si  interpolamos  la  función 
f(x )  =  x4  +  2x3  —  x2  +  x  +  1  en  los  puntos  {—2, —1,0, 1},  debido  a  la  unicidad,  el  polinomio  de 
interpolación  es  po{x)  =  3x  +  1. 

[>  Aunque  el  método  de  los  coeficientes  indeterminados  es  el  primer  método  en  el  que  se  piensa  cuando  se 
intenta  hallar  el  polinomio  de  interpolación  pni  resulta  excesivamente  laborioso  cuando  n  no  es  pequeño. 
Conviene  entonces  recurrir  a  otros  métodos.  Describimos  a  continuación  dos  alternativas  que  son  muy 
adecuadas  para  implementarse  en  un  ordenador:  el  polinomio  de  Lagrange  y  el  polinomio  de  Newton. 
Aplicaremos  la  expresión  más  conveniente  según  sean  los  datos  del  problema. 
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Polinomio  de  interpolación  de  Lagrange 

Comenzamos  con  el  polinomio  de  interpolación  de  Lagrange ,  que  se  define  de  la  siguiente  manera: 


Pn(x)  =  ^2fA(x), 
i= 0 


donde 


n 

Mx) = n 


i— o 


X  —  Xj 
Xi  —  Xj 


Los  polinomios  se  denominan  polinomios  fundamentales  de  Lagrange. 

Obsérvese  que  £¿(x¿)  =  1  y  l. ¿(x^ )  =  0,  de  manera  que 

pn  es  un  polinomio  de  grado  n  y  pn{xi)  =  fi  (*  =  0,1,...,  n). 

Luego  el  polinomio  de  interpolación  de  Lagrange  es  efectivamente  el  polinomio  solución  del  problema  de 
interpolación. 


Ejemplo.  Veamos  cuál  es  el  polinomio  de  interpolación  de  Lagrange  que  interpola  los  datos  de  la  siguiente 
tabla: 


X 

0 

7t/2 

7 r 

f 

0 

1 

0 

Los  polinomios  fundamentales  de  Lagrange  son: 

_  (x  -  xi)(x  -  x2)  _  (x  -  7r/2) (a:  -  7 r)  _ 
°  X  (x0 -xi)(x0 -x2)  (0  -  7t/2)(0  -  ít) 

_  (x  -  x0)(x  -  x2)  _  (: x  -  0)(x  -  7 r) 

1  X  {x\  —  xq)(xi  —  x2)  (tt/2  -  0)(7t/2  -  7r) 

_  (a;  -  x0)(x  -  xi)  _  (x  -  0)(x  -  tt/2)  _ 

2  X  (x2  -  x0)(x2  -  xi)  (tt  -  0)(tt  -  7t/2) 


2 

2  (x  7t/2)(x  7r) , 

7TZ 

4  /  N 

= - yx(x-TT), 

7T“ 

2 

y  x(x  -  7t/2). 

7T 


Luego  el  polinomio  de  interpolación  será: 

2  4 

p2(aO  =  0  ^  (x  -  7t/2)(x  —  7r)  —  1  — ^  x(x  -  7r 

7TZ  7T“ 

Si  los  datos  de  la  tabla  corresponden  a  la  función  f(x)  = 
f{x)  mediante  el  polinomio  p2(x).  □ 


2  4  o 

)  +  0  —¡r  x(x  -  7t/2)  = - ?(x2  -  7TX). 


senx,  vemos  en  la  figura  4.3  la  aproximación  de 


Figura  4.3:  Función  y  =  senx  (línea  continua)  y  su  polinomio  de  interpolación  y  =  p2{x)  =  —  yv(x2  —  7rx)  en 
los  nodos  xq  =  0,  Xi  =  §  y  x2  =  7T  (parábola  discontinua). 


Comentario  adicional.  >  Una  ventaja  del  polinomio  de  interpolación  de  Lagrange  es  que  su  imple- 
mentación  en  el  ordenador  es  muy  sencilla.  Otra  ventaja  es  que  si  queremos  resolver  varios  problemas 
de  interpolación  con  los  mismos  nodos,  entonces  solo  tendremos  que  modificar  los  valores  de  ft  una  vez 
calculados  los  polinomios  fundamentales  de  Lagrange. 
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Polinomio  de  interpolación  de  Newton 

Vamos  a  estudiar  a  continuación  un  método  más  eficiente  de  construcción  del  polinomio  de  interpolación. 
Si  construimos  el  polinomio  de  interpolación  por  cualquiera  de  los  dos  métodos  anteriores  y,  por  alguna  cir¬ 
cunstancia,  necesitamos  añadir  un  nuevo  punto  (xn+i .  fn+i),  en  ambos  casos  se  tienen  que  rehacer  todos  los 
cálculos  para  determinar  el  nuevo  polinomio  de  interpolación.  La  formula  de  Newton  permite  calcular  este 
nuevo  polinomio  pn+i  conocido  el  polinomio  anterior  pn.  Para  ello  es  necesario  expresar  el  polinomio  de  inter¬ 
polación  pn  en  términos  de  «diferencias»  (divididas)  de  valores  de  la  función  en  los  puntos  de  interpolación. 
Así: 


Dado  m  >  0,  si  definimos  f[xi]  =  /»,*  =  0, 1, ... ,  n,  se  denomina  diferencia  dividida  de  orden 
m  de  /  en  el  punto  a y  se  denota  por  /[£.¿,£.¿+i, . . . ,  x¿+TO_i, £¿+m],  al  cociente: 


f\Xí ,  £-¿-{-1 ,  .  .  .  ,  i , 


f\xi ,  £2  +  1 ,  .  .  .  ,  l]  f  [£¿+1  í  •  •  •  ?  £¿+m— 1  >  £2+772] 


A  partir  de  las  diferencias  divididas,  el  polinomio  de  interpolación  se  determina  como 


n 

Pn{x)  =  f[x  o]  +  ^ 
Í=  1 


i- 1 


/[£0)£i,...,£¿]  JJ(£-£j) 

3  = 0 


que  se  conoce  como  polinomio  de  interpolación  de  Newton. 

Si  añadimos  a  continuación  un  nuevo  par  de  interpolación  (£n+i,  /n+i),  el  nuevo  polinomio  de  interpolación 
se  puede  expresar  como: 

n 

Pn+l{x)  =  pn(x)  +  f[x0,  £i,  .  .  .  ,£„+l]  JJ(£  -  Xj). 

3=0 


Comentarios  adicionales.  >  Una  ventaja  del  polinomio  de  interpolación  de  Newton  radica  en  el  hecho 
de  que  añadir  nuevos  nodos  no  afecta  a  los  coeficientes  ya  calculados,  por  lo  que  se  puede  ir  aumentando 
el  grado  del  polinomio  y  conseguir  la  precisión  deseada  sin  tener  que  calcular  de  nuevo  todos  los  coefi¬ 
cientes,  ya  que,  por  construcción,  cada  polinomio  se  obtiene  del  anterior  mediante  la  última  igualdad. 
Como  consecuencia  de  este  hecho,  se  suelen  tomar  los  nodos  en  cierto  orden,  considerando  primero  los 
más  próximos  al  punto  que  nos  interesa,  aunque  el  polinomio  obtenido  finalmente  es  independiente  del 
orden  considerado. 


t>  Obsérvese  que  las  diferencias  divididas  son  recursivas,  puesto  que  las  de  orden  superior  se  calculan  a 
partir  de  las  de  orden  inferior.  Esta  propiedad  de  la  recursividad  es  muy  aprovechable  a  la  hora  de 
implementar  eficientemente  este  método  en  un  ordenador. 

o  Las  expresiones  de  los  polinomios  de  interpolación  de  Lagrange  y  de  Newton  requieren  de  un  trabajo 
computacional  semejante  cuando  solo  se  desea  realizar  una  interpolación,  aunque  el  de  Lagrange  es  más 
fácil  de  implementar  en  un  ordenador  debido  a  que  no  requiere  calcular  ni  almacenar  las  diferencias 
divididas.  Si  a  priori  no  se  conoce  el  grado  del  polinomio  de  interpolación,  la  expresión  de  Newton  es 
más  conveniente,  como  podría  ocurrir  por  ejemplo  en  el  caso  de  que  fuera  mejor  no  utilizar  todos  los 
nodos  del  conjunto  de  datos  disponibles. 

t>  Los  polinomios  de  Lagrange  y  de  Newton  no  proporcionan  un  polinomio  en  su  forma  convencional,  tal 
y  como  hace  el  método  de  los  coeficientes  indeterminados,  pero  son  técnicas  más  eficientes. 


Ejemplo.  Obtengamos  a  continuación  la  fórmula  de  interpolación  de  Newton  para  la  siguiente  tabla: 


X 

2 

4 

6 

8 

f 

4 

8 

14 

16 
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Construimos  el  siguiente  cuadro  sinóptico  para  las  diferencias  divididas 


/ 

0 


/[  2,4] 


6 

8 


/[4,6] 


14 


/[6,8] 

16 


/  [2, 4,  6] 

14-8  _  o 
6-4  —  ° 

/[4, 6, 8] 

16-14  _  i 
8-6  L 


3-2  _ 

6-2 

/[2, 4, 6, 8] 

1-3  _1 

8-4  2 


1 

4 


—  1/2  —  1/ 4  _  _1 
8-2  8 


Y,  a  partir  de  la  diagonal  superior  de  cuadro  anterior,  construimos  el  polinomio  de  interpolación:  p¡(x)  = 
4  +  2(x  —  2)  +  j(x  —  2)(x  —  4)  —  |(x  —  2)(x  —  4)(x  —  6)  =  —  |x3  +  |x2  —  5x  +  8.  □ 


Error  de  interpolación 

A  la  hora  de  reemplazar  el  valor  de  la  función  /  por  su  polinomio  de  interpolación  pnf  en  puntos  distintos 
de  los  puntos  de  interpolación  es  importante  estimar  el  error: 


Enf(x)  =  f(x)  -  pnf(x),  x£[a,b], 


donde  [a,  b]  es  un  intervalo  que  contiene  a  los  nodos  de  interpolación. 

Si  la  función  /  está  tabulada  y  no  conocemos  su  expresión  analítica,  no  podemos  estimar  el  error  que  se 
comete  con  el  polinomio  pnf  cuando  reemplaza  a  la  función  /. 

Cuando  la  función  /  es  suficientemente  regular,  podemos  evaluar  el  error  obtenido,  cuando  reemplazamos 
/  por  su  polinomio  de  interpolación  pnf ,  mediante  el  siguiente  resultado: 


Si  Pnf(x)  interpola  a  la  función  /(x)  en  los  nodos  distintos  x¿,  i  =  0, 1, . . . ,  n,  y  /(x)  tiene  derivadas 
continuas  hasta  orden  n+1  en  un  intervalo  [a,  b]  que  contiene  a  los  nodos  de  interpolación,  entonces 
para  cualquier  x  £  [a,  6],  existe  un  £  £  [a,  b]  tal  que 


E„f(x)  =  f(x)  Pnf  (x)  = 


/(n+1)(0 

(n  + 1)! 


(x 


x0)(x 


X\)  ■  ■ ■ (x 


Xn). 


Obviamente,  Enf(xi)  =  0,  i  =  0, 1, . . . ,  n. 

Por  otra  parte,  si  los  puntos  de  interpolación  están  uniformemente  distribuidos  en  el  intervalo  [a,  6],  es 
decir,  x¿  =  a  +  con  *  =  0, 1, . . . ,  n,  y  h  =  h~a ,  entonces  se  puede  demostrar  que 

\Enf{x)\  <  1^~  má* ,|/("+1)(x)|. 

yn  +  lj!  xe[a,b] 

De  modo  que  si  máxxe[a  h]  |/(n+1)(x)l  <  M,  donde  M  es  una  constante  independiente  de  n,  entonces  el  error- 
de  interpolación  tiende  a  cero  según  h  se  va  acercando  a  cero.  Éste  es  el  caso  de  las  funciones  trigonométricas 
sen(x),  cos(x)  y  de  la  exponencial  ex  en  un  intervalo  finito. 

Ejemplo.  Calculemos  una  cota  del  error  cuando  se  aproxima  /(x)  =  cosx  mediante  un  polinomio  de  in¬ 
terpolación  con  11  nodos  igualmente  espaciados  en  [1,2].  Como  n  =  10,  a  =  1,  b  =  2,  f^^x)  =  senx  y 
\f(11\x)\<l  =  M,  se  obtiene  h  =  1/10  y 

\Enf{x)\<  (1/111°!)U  sa  2.50  x  10~19.  □ 

La  propiedad  anterior  (derivadas  de  todo  orden  acotadas  uniformemente)  no  la  poseen  todas  las  funciones. 
El  ejemplo  clásico  es  la  función  de  Runge  (0): 
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Si  la  función  f(x)  =  se  interpola  en  puntos  equiespaciados  en  el  intervalo  [—5,5],  el  error 
máxa,g[_5j5]  \Enf(x)\  tiende  a  infinito  cuando  n  — >  oo.  Esto  se  debe  al  hecho  de  que,  si  n  — >  oo, 
el  orden  de  magnitud  de  máx,¡,g[_5i5]  |/("+1) (x) |  pesa  más  que  el  orden  infinitesimal  de  - 

Obsérvese  en  la  figura  |4~4|  que,  al  aumentar  el  grado  del  polinomio,  en  vez  de  mejorar  la  aproxi¬ 
mación  global,  empeora,  puesto  que  los  polinomios  de  interpolación  se  desvían  cada  vez  más  de 
la  función,  sobre  todo  cerca  de  los  extremos.  Esta  función  indica  que  al  aumentar  el  grado  n  del 
polinomio  de  interpolación,  no  necesariamente  obtenemos  una  mejor  reconstrucción  de  la  misma. 


Figura  4.4:  Polinomios  de  interpolación  de  grados  4,  8,  12  y  16  (líneas  discontinuas)  junto  a  la  función  de 
Runge  /( x)  =  [  -a  (línea  continua). 


Comentario  adicional.  >  Para  que  la  expresión  anterior  del  error  de  interpolación  sea  útil,  debemos 
conocer  la  función  /,  que  además  debe  ser  diferenciable,  lo  que  puede  no  ocurrir.  Hay  una  fórmula 
alternativa  que  no  requiere  del  conocimiento  previo  de  la  función  y  que  utiliza  una  diferencia  dividida 
para  aproximar 

Enf{x)  ~  f[x0,x i, . .  ,,xn,x](x  -  x0)(x  -  X!)  ■  ■  ■  (x  -  xn), 

pero  esta  fórmula  no  permite  encontrar  el  error,  puesto  que  contiene  la  incógnita  f(x).  Sin  embargo,  si 
se  tiene  un  dato  más,  f(xn+ 1),  podemos  utilizar  la  fórmula  anterior  de  la  siguiente  forma  para  estimar 
el  error: 

Enf{x)  ^  f[x 0,xi, . .  .,xn+1](x  -  x0)(x  -  aq)  ■  ■■  (x  -  xn). 

Además,  como  el  error  se  anula  en  los  nodos  de  interpolación,  deducimos  la  siguiente  propiedad  de  las 
diferencias  divididas: 

Si  /  es  derivable  con  continuidad  hasta  la  derivada  n-ésima  en  un  intervalo  I  y  xq,  Xi,  . . . ,  xn+± 
son  n+í  puntos  distintos  del  intervalo  I,  entonces  existe  un  punto  £,  comprendido  entre  el 

/(")(£) 

menor  y  el  mayor  de  los  x tal  que  f[x o,  x±, . . . ,  xn]  =  - ¡ — . 

ni 

4.2.2.  Interpolación  mediante  funciones  splines 

El  problema  de  la  interpolación  polinómica  de  Lagrange  presenta  inconvenientes  cuando  hay  muchos  nodos 
o  cuando  la  función  a  interpolar  no  se  parece  mucho  a  un  polinomio.  El  aumento  del  número  de  nodos  y, 
por  tanto,  del  grado  del  polinomio,  en  lugar  de  proporcionar  más  precisión,  provoca  mayores  oscilaciones  del 
polinomio  de  interpolación  e  inestabilidad  en  el  cálculo  como  hemos  visto  para  la  función  de  Runge. 

Para  evitar  estos  problemas,  podemos  utilizar  una  alternativa  que  consiste  en  dividir  el  intervalo  en  un 
número  finito  de  subintervalos  y  construir  un  polinomio  de  aproximación  diferente  en  cada  subintervalo,  lo 
que  se  conoce  como  aproximación  polinómica  segmentaria  o  aproximación  polinomial  a  trozos.  Esta 
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aproximación  evita  los  inconvenientes  mencionados  anteriormente  limitando  el  grado  del  polinomio.  Como 
contrapartida,  las  condiciones  de  interpolación  se  satisfacen  localmente,  utilizando  polinomios  distintos  en 
cada  intervalo.  La  curva  así  construida  se  conoce  como  spline,  que  es  un  polinomio  a  trozos  lo  más  suave  posible 
en  todos  los  puntos  en  los  que  los  polinomios  se  juntan.  La  obtención  de  los  polinomios  es  numéricamente 
estable  y  puede  hacerse  utilizando  matrices  dispersas  (matrices  con  muchos  ceros),  véanse  ¡5j  E] ■ 

La  aproximación  polinomial  a  trozos  más  habitual,  por  sus  propiedades  de  suavidad  y  simplicidad,  utiliza 
polinomios  cúbicos  en  cada  subintervalo  y  se  llama  interpolación  mediante  splines  cúbicos.  Un  spline  cúbico 
se  define  de  la  siguiente  manera. 

Dados  los  puntos  a  =  xq  <  X\  <  ■  •  •  <  xn  =  b,  llamamos  función  spline  cúbico  a  una  función  S(x) 
definida  en  [a,  b]  tal  que: 

■  la  restricción  de  S( x)  a  cada  subintervalo  [xj,Xj+ 1],  que  denotaremos  por  Sj(x),  j  =  0, 1, ... ,  n— 

1,  es  un  polinomio  cúbico, 

■  S(x)  es  derivable  con  continuidad  hasta  la  segunda  derivada  en  [ a,b ]. 

Notemos  que  el  intervalo  [a,  b]  se  subdivide  en  varios  subintervalos  y  los  valores  que  dividen  el  intervalo 
se  llaman  nudos,  que  pueden  ser  los  mismos  que  los  nodos,  pero  que  no  siempre  es  el  caso. 

Para  construir  el  spline  cúbico  S(x)  que  interpole  a  /  en  los  nodos 

a  =  x0  <  X\  <  ■  ■  ■  <  xn  =  b, 

aplicamos  la  primera  condición  de  la  definición  a  los  polinomios  cúbicos  y  escribimos  S  (x)  en  cada  subintervalo 
[xj,Xj. |_i]  de  la  forma: 

Sj(x)  —  üj  +  bj(x  —  Xj )  +  Cj(x  —  Xj )2  +  dj(x  —  Xj)3  =  S(x),  j  =  0, 1, . . . ,  n  —  1, 

donde  aj,  bj,  Cj  y  dj  son  las  constantes  a  determinar  (4n  incógnitas). 

Como  queremos  que  S  interpole  a  /,  se  tiene  que  cumplir  que 

S{xj)  =  fj  =  f(xj)  =>  aj  =  f(xj),  j  =  0, 1, . . . ,  n, 

de  manera  que  tenemos  n  +  1  ecuaciones. 

Para  determinar  bj,  Cj  y  dj,  usamos  la  segunda  condición  de  la  definición,  que  dice  que  S,  S'  y  S"  son 
continuas.  Por  lo  tanto, 

1)  =  ‘5j'+l(ab'  +  l)>  Sj{xj+ 1)  =  'Sj'+lí-L/'  +  l);  Sj  (xj+ 1)  =  ‘Sj'+iOLj'+i): 

para  cada  j  =  0, 1, . . . ,  n  —  2.  Cada  una  de  estas  igualdades  da  n  —  1  ecuaciones. 

En  total,  se  tienen  (n+l)+3(n— 1)  =  4n— 2  ecuaciones,  pero  4n  incógnitas.  Entonces,  es  necesario  imponer 
dos  condiciones  más  al  spline  cúbico  S  para  poder  determinarlo.  Las  dos  opciones  más  frecuentemente  usadas 
son: 


■  Condiciones  de  frontera  libre:  S"(x o)  =  0  (=>  cq  =  0)  y  S"{xn)  =  0  (=>  cn  =  0);  la  función  S  resultante 
se  llama  spline  cúbico  natural. 

.  Condiciones  de  frontera  fija:  S'(  x0)  =  f{x  0)  (=>  b0  =  f'(x  0))  y  S'(xn)  =  f'{xn)  (=>  bn  =  f(xn));  S 
recibe  el  nombre  de  spline  cúbico  sujeto. 

En  ambos  casos  se  tienen  4n  ecuaciones  con  4 n  incógnitas. 

Como  los  términos  Xj+ 1  —  Xj  aparecerán  repetidamente  en  el  desarrollo,  es  conveniente  que  introduzcamos 
una  notación  más  simple: 

hj  =  xj+i-Xj,  j  =  0, 1,. . .  ,n  -  1. 

De  5j+i(x¿+i)  =  Sj(xj+ 1)  se  sigue  que 

<U+i  =  f{xj+ 1)  =  SJ+i(xj+ 1)  =  Sj{xj+ 1)  =  aj  +  bj hj  +  Cjh3  +  djh3,  j  =  0, 1, . . . , n  -  1.  (4.1) 

Como  Sj(x)  =  bj  +  2cj(x  —  Xj)  +  3dj(x  —  Xj)2  y  S"(x)  =  2c j  +  6dj(x  —  Xj),  entonces,  por  la  continuidad  de 
la  primera  derivada,  tenemos 

bj-\.\  —  (xj-|_i)  —  Sj ( Xj -f i )  —  bj  “h  2¡Cjhj  H-  3 djhj,  j  —  0, 1, . . . ,  n  1. 


(4.2) 
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Análogamente  por  la  continuidad  de  la  segunda  derivada 

2cj+i  =  S'J+1(xj+ 1)  =  S"(xj+ 1)  =  2 cj  +  Qdjhj  =>  Cj+i  =  Cj  +  3djhj,  j  =  0, 1, . . . , n  —  1.  (4.3) 


Despejando  ahora  de  la  igualdad  anterior  dj  y  sustituyendo  su  valor  en  (4.1 1,  después  de  reordenar  esta 
ecuación,  se  sigue  que 

bj  dj')  ^  (^i+i  4“  ^Cj),  J  0, 1, . . .  ,n  1, 


Análogamente,  despejando  dj  de  la  igualdad  (4.3 1  y  sustituyendo  su  valor  en  (4.2 1,  obtenemos 

bj~\~ i  —  bj  hj(cj+i  2 Cj)7  j  —  0,1,..., 7z  1. 


Finalmente,  combinando  las  ecuaciones  anteriores,  tenemos 

3  3 

bj  Cj  2( hj  hjj_i)cj  hjj_\Cjjr2  j  2  ®j-\- 1)  t  (^b'+l  J  0, 1, . . . ,  n  2. 

% 

El  cálculo  de  Cj  se  realiza  resolviendo  el  sistema  lineal  Ax  =  b,  de  orden  n+ 1,  donde  x  =  (co,  Ci, . . . ,  cn)T 
es  el  vector  de  las  incógnitas,  b  el  vector  de  los  términos  independientes  y  A  la  matriz  de  coeficientes  (matriz 
tridiagonal  estrictamente  dominante). 

Las  expresiones  de  la  matriz  A  y  el  vector  b  que  se  obtienen  para  el  spline  cúbico  natural  son  (0) 


/I  0 

h0  2(/io  +  h\) 
0  hx 


A  = 


0 

0 

\o 


0  o 

hx  0 

2(úi  +  /12)  /12 


0  \ 
0 

0 


bn—2  2(/in_ 2  ~\~  hn—x)  bn—x 

o  o  1 


b  = 


h  „_1 


^(a2-ai)-^(ai-a0) 


( Q’n  ^n—  l)  u  (&n— 1  ^n— 2) 


y  para  el  spline  cúbico  sujeto 


/2ho  h0 

ho  2(/io  +  hx) 
0  hx 


A  = 


0 
0 
V  o 


b  = 


0 


0  0 

hx  0 

2(/ii  +  /12)  /12 


/ 


^(ai-a0)  -3f(a) 

^(°2-ar)  -  ^(°i  -°o) 


\ 


hn  —  1 


(dn  dn—x)  hn  — 2  1  2) 

V  3/'(6)  -  ~  “«-O  y 


0  \ 
o 

o 


o 


hn— 2  2(/¿n_ 2  4“  hn—x)  hn— x 

hn— 1  2 hn—x) 


Por  las  propiedades  de  la  matriz  A,  los  sistemas  de  ecuaciones  lineales  se  pueden  resolver,  en  ambos  casos, 
mediante  el  método  de  eliminación  de  Gauss  sin  pivoteo  o  la  factorización  LU  de  Doolitte.  Y  para  el  caso 
de  sistemas  grandes  (n  grande),  tanto  el  método  de  Jacobi  como  el  de  Gauss-Seidel  convergen  a  la  solución 
exacta  (siendo  este  último  más  rápido). 


48 


CAPÍTULO  4.  APROXIMACIÓN  DE  FUNCIONES  Y  DATOS 


Ejemplo.  Construimos  un  spline  cúbico  sujeto  que  se  ajuste  a  la  tabla 


X 

0 

1 

2 

3 

f 

0 

1/2 

2 

3/2 

(4.4) 


y  que  verifique  las  condiciones  S'(0)  =  1/5  y  S'( 3)  = 

h.Q  =  h\ 

ao  =  f(x  o)  =  0,  ai  =  f(xi)  = 


—  1.  Calculamos  primero  las  siguientes  igualdades: 
=  h2  =  1, 

3 

02  =  f(x2)  =  2,  a3  =  f(x3)  = 


Como  n  =  3,  tenemos 


cuya  solución  es 


Ahora 


(2 

1 

0 

°\ 

^c0\ 

1 

4 

1 

0 

Cl 

0 

1 

4 

1 

C2 

V° 

0 

1 

2/ 

\C3J 

9  63 

C°~~5Ó’  Cl  50’ 


/  3  _  3  \ 
r  2  5 

/  JL\ 
r  10 

9  3 

2  2 

3 

3  9 

2  2 

-6 

V  3+ 

1-1/ 

93 

9 

°2  ~~  50  ’ 

C3 

“  50 

ai  —  ao 

(2co  +  Ci)/io 

1 

ho 

3 

5’ 

a2  -  ai 

(2ci  +  c2)/ii 

32 

hi 

3 

25' 

a3  -  a2 

(2c2  +  c3)h2 

17 

h2 

3 

25 : 

do 

di 

d2 


Cl  —  C  o 

3/io 

C2  -  Cl 

3/q 

c3  -  c2 
3ú2 


12 
25’ 
26 
25  ’ 
17 
25' 


Luego 


S(a;)  =  < 


50(x)  =  a0  +  b0(x  -  x0)  +  c0(x  -  x0)2  +  d0(x  -  x0) 

Si{x) 

S2(x) 


iT  -  -9-t2  i  12  3 
5  50  '  25  ’ 

ai  +  6i(a;  —  x3)  +  c3(x  —  x±)2  +  di(x  —  aq)3 
I  +  I(*-1)  +  ¥0(x-l)2-§(x-l)3, 
a2  +  b2(x  -  x2 )  +  c2(x  -  x2)2  +  ¿2(2:  -  a’2)3 


=  2+3Mx-2)-fJx-2f+mx-2) 


En  la  figura  4.5  podemos  ver  la  gráfica  del  spline  cúbico  anterior  S(x).  □ 


0  <  x  <  1, 
1  <  x  <  2, 


2  <  x  <  3. 


Figura  4.5:  Spline  cúbico  sujeto  y 


S(x)  que  interpola  la  tabla  de  datos  4.4 


4.3.  APROXIMACIÓN  DE  MÍNIMOS  CUADRADOS 
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4.3.  Aproximación  de  mínimos  cuadrados 

Habitualmente  los  datos  obtenidos  a  partir  de  experimentos  conllevan  errores  sustanciales,  de  manera 
que  la  interpolación  puede  ser  inadecuada  y  dar  resultados  poco  satisfactorios  cuando  se  utiliza  para  pre¬ 
decir  valores  intermedios.  Una  estrategia  más  adecuada  en  estos  casos  consiste  en  obtener  una  función  de 
aproximación  que  se  ajuste  a  la  tendencia  general  de  los  datos,  aunque  no  coincida  en  todos  ellos.  Diferentes 
funciones  de  aproximación  se  podrían  entonces  trazar,  pero  es  conveniente  dar  algún  criterio  que  sirva  de 
base  para  el  ajuste  de  los  datos.  Una  opción  consiste  en  encontrar  una  curva  que  minimice  la  discrepancia 
entre  los  datos  y  la  curva.  Un  procedimiento  que  se  puede  utilizar  para  alcanzar  dicho  objetivo  es  el  método 
de  mínimos  cuadrados. 


4.3.1.  Aproximación  discreta  de  mínimos  cuadrados 

Sea  un  conjunto  discreto  de  puntos  xq,xi,...,  xn  en  el  intervalo  [a,  b }  y  sean  n  +  1  valores  reales  y¿,  de 
forma  que  se  tienen  los  pares  (£í,y¿).  Los  puntos  y  i  han  sido  obtenidos  mediante  mediciones  experimentales 
sobre  cada  punto  a o  bien,  porque  cumplen  y,  =  f{x¡)  para  una  función  f[x)  conocida  al  menos  en  los 
puntos  Xi .  Dado  un  conjunto  de  funciones  conocidas  fj{x),  j  =  0,1,...,  m,  definidas  sobre  [a,  6],  queremos 
encontrar  la  función 

m 

uix)  =  X!  ajfAX)’  a3  e 

J=0 

que  mejor  se  ajusta  a  los  puntos  dados,  en  el  sentido  de  minimizar  el  error  cuadrático 


-  u(xi)f 


¿=o 


Nota.  Las  funciones  fj(x),  j  =  0, 1, ... ,  m,  definidas  sobre  [a,  6]  se  escogerán  dependiendo  de  la  forma  de 
la  nube  de  puntos  ( ),  o  bien,  de  las  sospechas  que  tengamos  respecto  al  comportamiento  de  f(x).  Por 
ejemplo,  si  observamos  comportamientos  periódicos,  convendrá  escoger  como  fj(x)  funciones  trigonométricas 
del  tipo  sen  (ja:)  y  cos(j;r),  j  =  0,1,...,  m;  si  observamos  un  comportamiento  polinómico,  escogeremos  fj(x) 
como  funciones  polinómicas  (por  ejemplo,  xJ ,  j  =  0,1,...,  m). 

Como  queremos  que 


-  u(xí))2  =  ^2  (  yi  -  ^2  aifAxi)  )  =  E(ao,  ai, 

3—0 


i= 0 


i= 0 


dE 


sea  mínimo,  tenemos  que  resolver,  para  cada  k  =  0, 1, . . . ,  m,  —  =  0,  i.e.: 

dak 


-2^  (  Vi  aj f j  i.xi)  ]  fk(xi )  =  0; 

3=0 


i= 0 


es  decir,  resolver 

n 

T.  (Vi  -  aofo{Xi) - Clmfm(Xi))  fk(xi)  =0,  k  =  0, 1, . . . ,  m. 

i= 0 

Agrupando  todos  los  üj  en  cada  ecuación,  se  tiene  que  se  pueden  escribir  como: 

n  n  n  n 

ap  y  fo(Xi)fk(Xi)  +  ai  y  fl(Xi)fk(Xj)  H - =  yyifk&i), 


2  =  0 


2= 0 


2  =  0 


2=0 


para  k  =  0, 1, ... ,  m.  Si  definimos  la  matriz  (n  +  1)  x  (m  +  1): 


M  = 


/  fo(xo)  fl(x0)  ...  fm(x  o)\ 
fo(Xi)  fl{Xi)  ...  fm(x  i) 


\fo(Xn)  fl(xn)  ...  fm(Xn)J 
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y  los  vectores  x  =  (ao,  ai, . . . ,  am)T  ey=  (yo,  yi, . . . ,  yn)T ,  entonces  las  m+ 1  ecuaciones  anteriores  se  pueden 
escribir  como 

MTMx  =  MT  y  o  Ax  =  b, 

donde  MTM  =  A  y  MT y  =  b,  que  es  un  sistema  lineal  de  m  +  1  ecuaciones  con  m  +  1  incógnitas.  La  matriz 
A  es  simétrica  por  definición,  y  se  tiene  el  siguiente  resultado: 

Las  funciones  fj(x),  j  =  0,1, ...  ,m,  son  linealmente  independientes  si  y  solo  si  la  matriz  A  es 
definida  positiva. 

Por  tanto,  si  tomamos  fj(x)  ( j  =  0, 1, . . . ,  m)  linealmente  independientes  (en  los  casos  trigonométrico  y 
polinómico  así  son),  se  tiene  que  el  sistema  anterior  tiene  una  única  solución  ay,  j  =  0, 1, . ..  ,m,  que  hace 
que  la  función  u(x )  =  ajfj ( x )  tenga  una  magnitud  de  error  de  aproximación  X)”=0(?/¿  —  u(xi))2  mínima 

entre  todas  las  funciones  de  este  tipo. 

La  solución  del  sistema  lineal  puede  entonces  calcularse  por  cualquiera  de  los  métodos  vistos  en  el  capítulo 
correspondiente,  siendo  especialmente  adecuado  el  de  Cholesky  por  ser  A  una  matriz  simétrica  y  definida 
positiva,  o  bien,  si  m  es  grande,  el  método  iterativo  de  Gauss-Seidel  por  el  mismo  razonamiento.  Además, 
véase  [T],  existen  otros  métodos,  que  no  veremos,  que  se  favorecen  de  que  el  sistema  Ax  =  b  se  puede  escribir 
de  la  forma  MTMx  =  MTy. 


Ejemplo.  Vamos  a  aplicar  la  aproximación  discreta  de  mínimos  cuadrados  para  obtener  la  recta  que  se 


ajusta  a  la  siguiente  tabla  de  datos: 


X 

-i 

i 

3 

y 

6 

i 

11 

Como  /o (x)  =  1  y  fi(x)  =  x,  tenemos  que 


(4.5) 


//o(-l)  /r(-l)\  (1  -l\ 

M=  /0(1)  /i(l)  =1  1 

V  /o(3)  /i(3)  J  V1  3  / 


Mt 


de  manera  que 


MtM 


MTy  = 


-1 


=  b 


y  el  correspondiente  sistema  lineal  Ax  =  b  de  dos  ecuaciones  con  dos  incógnitas  tiene  como  única  solución  x  = 
(ao,  a±)T  =  (4.75,  1.25)t.  Por  lo  tanto,  la  recta  de  mínimos  cuadrados  que  se  obtiene  es  u(x)  =  4.75  +  1.25  x, 
que  está  representada  en  la  figura  |4.6[  □ 


Figura  4.6:  Aproximación  discreta  de  mínimos  cuadrados  que  ajusta  la  tabla  de  datos  4.5 


4.3.2.  Aproximación  continua  de  mínimos  cuadrados 

El  método  de  mínimos  cuadrados  sirve  también  para  aproximar  no  solo  un  conjunto  discreto  de  puntos, 
sino  también  toda  una  función  en  un  intervalo.  Así,  si  queremos  aproximar  una  función  f(x)  en  un  intervalo 


4.4.  SUGERENCIAS  PARA  SEGUIR  LEYENDO 
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[a,  b]  mediante  el  polinomio 


pm(x)  =  a0  +  a-íX  H - b  am_iXm  1  +  amxn 


tendremos  que  minimizar  en  este  caso  la  función  de  error 

rb 


E(a0,ai,...,am)=  /  (f(x)-pm(x))2dx. 
J  a 


Derivando  parcialmente  respecto  a  los  coeficientes  del  polinomio  e  igualando  a  cero  se  obtienen  las  ecuaciones 

ar  rb 

- —  =  2/  (f(x)  -pm{x))xk  dx  =  0,  fc  =  0,l,...,TO, 
üak  Ja 


que  nos  llevan  a  un  sitema  lineal  Ax  =  b,  donde  A  =  (a¿j)  es  una  matriz  ( m  +  1)  x  ( m  +  1)  con 

«-I* 


0,0  q  - 


X 


‘"V"1  d®, 


x 


=  (oq,  ai, ,  am)T  y  b  es  el  vector  con  coordenada  ¿-ésima 


rb 

bi=  xl~1f(x)dx. 
J  a 


De  nuevo  A  es  simétrica  y  definida  positiva  y  la  solución  del  sistema  lineal  puede  calcularse  por  cualquiera 
de  los  métodos  vistos  con  anterioridad,  siendo  especialmente  adecuado  el  de  Cholesky  por  ser  A  simétrica  y 
definida  positiva,  o  bien,  si  m  es  grande,  el  método  iterativo  de  Gauss-Seidel  por  el  mismo  motivo. 

Ejemplo.  Calculamos  el  polinomio  de  grado  dos  P2(x)  =  ao  +  a\X  +  a^x1  mejor  aproximación  de  mínimos 
cuadrados  de  la  función  f(x)  =  semrx  en  el  intervalo  [0, 1].  Los  elementos  de  la  matriz  A  =  ( a^- )  y  del  vector 
b  =  (6¿)  serán: 


an  =  Jo  1  •  1  dx  =  1, 

021  =  fo  x  ■  1  dx  =  \ , 

031  =  fo  x2  ■  ldx  =  |, 

bi  =  /q1  1  •  sen  ttx  dx  =  ^ , 
de  forma  que  el  sitema  lineal  Ax  =  b  es 

/I 


012  =  fo  1  •  xdx  = 


a 22  =  fg  x  ■  x  dx  =  | , 
032  =  f0X  X2  ■  xdx  = 


013  =  fo  1  •  X2  dx  =  i , 

023  =  fo  x  ■  X2  dx  =  | , 

033  =  fgX2  ■  X2  dx  = 

63  =  fo  x2  ■  sen  7 tx  dx  =  7r7r74 , 


cuya  solución  es 


Por  tanto,  P2{x)  = 


«o  — 


12(t r2  -  10) 


oí  = 


60(12  -  7T2) 


7T3  ’  7T3 

12(7 r2  -  10)  60(12  -  7T2)  60(tt2  -  12) 


02  = 


60(tt2  -  12) 


7T 


x2.  Véase  la  figura  y  □ 


4.4.  Sugerencias  para  seguir  leyendo 

Una  de  las  referencias  más  completas  con  un  tratamiento  matemático  avanzado  de  la  interpolación  y 
la  aproximación  es  Davis  (1975).  También  se  pueden  consultar  [13] ,  Ralston  y  Rabinowitz  (2001)  o  Stoer  y 
Bulirsch  (2002) .  Una  excelente  descripción  de  la  interpolación  mediante  funciones  splines  está  dada  en  De  Boer 
(2001).  Para  una  introducción  a  la  aproximación  mediante  funciones  racionales,  se  pueden  consultar  Ralston 
y  Rabinowitz  (2001)  o  Stoer  y  Bulirsch  (2002).  Una  gran  variedad  de  problemas  y  diferentes  enfoques  de  la 
teoría  de  aproximación  pueden  verse  en  Davis  (1975)  y  Lorentz  (2005).  En  [17]  y  Atkinson  (1989)  podemos 
ver  una  introducción  a  la  interpolación  trigonométrica.  Una  interesante  discusión  sobre  la  interpolación  en 
dos  dimensiones  se  encuentra  en  Lancaster  y  Salkaukas  (1986). 
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Figura  4.7:  Función  y  =  sen-ira;  en  el  intervalo  [0, 1]  (línea  continua)  y  su  polinomio  y  =  p2(a;)  mejor  aproxi¬ 
mación  de  mínimos  cuadrados  (línea  discontinua) . 


4.5.  Ejercicios 


1.  Interpolación  de  Taylor.  Dados  los  valores  de  la  función  /  y  sus  derivadas  sucesivas  hasta  orden  n  en 
un  punto  Xq  (es  decir,  f^k\xo)  para  fe  =  0, 1, ,  n),  encuéntrese  un  polinomio  pn  de  grado  <  n  tal  que 
Pn\x  o)  =  f^k\x  o)  para  todo  k  =  0, 1, . . . ,  n.  Determínese  que  el  problema  de  interpolación  de  Taylor 
tiene  solución  única.  (Obviamente  la  función  /  ha  de  tener  n  derivadas  en  el  punto  Xo.) 

2.  Sea  la  siguiente  tabla  de  la  función  f(x)  =  ex 


X 

0.0 

0.2 

0.4 

0.6 

f{x) 

1.0000 

1.2214 

1.4918 

1.8221 

a)  Calcúlese  y/e  por  interpolación  cuadrática.  Utilízese  primero  los  puntos  0.0,  0.2  y  0.4  y  posterior¬ 
mente  los  puntos  0.2,  0.4  y  0.6.  Compárense  los  resultados. 

b)  Calcúlese  y/e  por  interpolación  cúbica  y  compárese  este  resultado  con  los  anteriores  y  con  el  valor 
exacto,  sabiendo  que  y/e  =  1.395612425. 


3. 


El  polinomio  p3(x)  =  2  —  (x  +  1)  +  x(x  +  1)  —  2x(x  +  l)(x  —  1)  interpola  los  cuatro  primeros  datos  de 
la  tabla 


X 

-1 

0 

1 

2 

3 

y 

2 

1 

2 

-7 

10 

Añádase  un  término  más  a  ps(x)  de  manera  que  el  polinomio  resultante  interpole  a  todos  los  datos  de 
la  tabla.  Calcúlese  también  el  polinomio  de  Lagrange  que  interpola  los  datos  de  la  tabla  anterior. 


4.  Demuéstrese  que  los  polinomios  fundamentales  de  Lagrange,  definidos  por  la  expresión  £k(x) 

n 

(fe  =  0, . . . ,  n),  verifican  £k{x)  =  1. 

k—0 


n 


X  —  Xj 
%k 


5.  Sea  el  polinomio  de  grado  dos  /(x)  =  3x2  —  x  +  1.  Constrúyase  el  polinomio  que  interpola  a  /  en  los 
puntos  xo  =  1,  Xi  =  2  y  x2  =  3.  ¿Se  vuelve  a  obtener  el  mismo  polinomio  /?  ¿Por  qué? 

6.  Sea  el  polinomio  de  grado  tres  /(x)  =  3x3  —  x  +  1.  Utilizando  diferencias  divididas,  constrúyase  el 
polinomio  que  interpola  a  /  en  los  puntos  Xo  =  —3,  Xi  =  —  1  y  X2  =  2.  Se  añade  a  continuación  un 
nuevo  punto  X3  =  1.  Sin  hacer  ningún  cálculo  adicional,  razónese  qué  valor  tomará  la  nueva  diferencia 
dividida  f[x o,  Xi,  X2,  X3]  y  cuál  será  el  coeficiente  director  (término  de  mayor  grado)  del  nuevo  polinomio 
de  interpolación  P3  de  /.  Calcúlese  P3  según  lo  anterior.  ¿Qué  ocurre  si  consideramos  X3  =  1.2  en  lugar 
del  punto  X3  =  1? 


7.  Importancia  de  la  selección  de  puntos  en  la  interpolación.  Como  parece  intuitivamente  lógico,  los  puntos 
de  interpolación  deben  estar  centrados  alrededor,  y  tan  cerca  como  sea  posible,  de  los  valores  deseados. 
Obsérvese  esta  realidad  a  la  hora  de  aproximar  el  valor  de  ln2  =  0.6931472  después  de  interpolar  la 
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función  f(x)  =  ln  x  en  los  valores  x  =  0, 4,  6,  5, 3, 1  mediante  polinomios  de  Newton  de  grados  1,  2  y  3. 
Estímese  a  continuación  el  error  de  cada  aproximación.  ¿Qué  indican  los  resultados  en  relación  con  el 
grado  del  polinomio  empleado  para  generar  los  datos?  Justifiqúese  la  respuesta. 

8.  Demuéstrese  que  los  polinomios  de  interpolación  de  Lagrange  y  de  Newton  coinciden,  es  decir: 


9. 


=  /[ar0]  +  ^2 

i— 0  i—1 

Sea  /( x)  la  siguiente  función  definida  en  [—1, 1] 


^/[aro,ari, . . 


í-í  \ 

Xi\  JJ(x  -  xj)\ 
j- o  / 


/O) 


0,  -1  <  x  <  -0.25, 

1  —  |4x|,  -0.25  <  x  <  0.25, 
0,  0.25  <  x  <  1. 


Encuéntrense  polinomios  de  grados  2,  3,  4  y  5  que  ajusten  a  /  en  puntos  igualmente  espaciados. 
Dibújense  estas  funciones  y  compruébese  que  el  ajuste  no  es  muy  bueno.  Finalmente,  utilízense  funciones 
splines  cúbicas  para  ajustar  la  función  anterior  tomando  como  nodos  cinco  puntos  equidistantes  entre 
-ly  1. 


10.  Sea  la  función  f{x)  =  ^  y  los  nodos  aro  =  1,  aq  =  2  y  X2  =  3. 


a)  Construyase  el  polinomio  de  interpolación  de  Newton  p2  de  /  con  los  nodos  dados. 

b )  Determínense  las  constantes  üq,  ai,  bo ,  &i  y  63  para  que  la  función 


S'(ar)  = 


a0  +  ai(ar  -  1)  +  yf(x  -  1)  -  g(x  -  l)3, 
bo  +  h(x  —  2)  +  j^(ar  —  2)2  +  63(3;  —  2)3, 


sea  el  spline  cúbico  con  condiciones  de  contorno  S"(l)  =  —  1  y  S"(3) 
nodos  dados. 


1  <  x  <  2, 

2  <  x  <  3, 

—  ^  que  interpola  a  /  en  los 


c)  Estímese  el  valor  de  /(1.5)  mediante  Pz(x)  y  S(x).  ¿Cuál  de  estas  dos  aproximaciones  es  mejor? 

d)  Si  añadimos  un  nodo  más,  X3  =  4,  determínese  el  polinomio  de  interpolación  p¡  de  /.  ¿Se  obtiene 
con  P3(x)  mejor  aproximación  del  valor  de  /(1.5)  que  las  obtenidas  en  el  apartado  anterior? 


11.  Sea  la  tabla  de  datos 


X 

10 

25 

40 

55 

y 

12 

26 

28 

30 

a)  Encuéntrese  un  spline  lineal  que  interpole  la  tabla  y  evalúese  en  x  =  20  y  x  =  45. 

b)  Encuéntrese  un  spline  cuadrático  que  interpole  la  tabla  y  evalúese  en  ar  =  20  y  ar  =  45. 

12.  Demuéstrese  que  la  solución  obtenida  u(pc)  en  la  aproximación  discreta  de  mínimos  cuadrados  coincide 
con  el  polinomio  de  interpolación  pn( x)  en  los  pares  de  puntos  (x¿,/(x¿))  si  n  =  m  y  fj(x)  =  x3 , 
j  =  0,1  ,...,m. 


13.  Hállese  el  polinomio  de  segundo  grado  mejor  aproximación  de  mínimos  cuadrados  para  cada  una  de  las 
siguientes  funciones  dadas  en  el  intervalo  indicado: 

a)  f(x )  =  —  en  [1,  2],  b)  f(x)  =  x3— 1  en  [0,  2],  c)  f(x)  =  cos7rx  en  [0, 1],  d)  f(x)  =  Ixl  en  [—1, 1], 
x 

14.  La  siguiente  tabla  de  datos 


X 

-1 

-0.75 

-0.5 

-0.25 

0 

0.25 

0.5 

0.75 

1 

y 

-3.4738 

0.4321 

6.5455 

-4.6710 

0.0012 

4.6797 

-6.5510 

-0.4375 

3.4815 

responde  a  una  función  del  tipo  u(x)  =  atg(bx).  Determínense  a  y  b  por  el  método  de  mínimos  cua¬ 
drados.  (Tómense  2.5  y  4.5  como  valores  iniciales  aproximados  de  a  y  b  respectivamente). 
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15.  Encuéntrese  la  mejor  aproximación  de  mínimos  cuadrados  en  los  puntos  (— 7r/2, 1),  (0,  0),  (7t/2,  1/2)  y 
(7 r,  1)  del  tipo  u(x)  =  a  +  rsen(x  +  a),  con  a,  r  reales  y  a  £  [0,  2tt\. 

16.  Transformación  de  una  ecuación  no  lineal  en  forma  lineal.  A  partir  de  los  siguientes  datos 


X 

1 

2 

5 

9 

y 

4.1 

3.4 

1.8 

0.8 

parece  claro  que  la  mejor  función  que  los  aproxima  es  de  tipo  exponencial  de  la  forma  u(x)  =  aebt. 
Determínense  entonces  los  valores  de  ay  b  por  el  método  de  mínimos  cuadrados.  ( Indicación :  linealícese 
la  función  u(x)  =  aebt  aplicándole  el  logaritmo  natural  para  expresarla  como  un  polinomio  lineal  y 
después  transfórmese  a  la  forma  deseada.) 


Capítulo  5 

Derivación  e  integración  numéricas 


5.1.  Introducción 

En  el  capítulo  anterior  se  ha  puesto  de  manifiesto  la  utilidad  del  polinomio  de  interpolación  de  una  función 
/  cuando  se  quiere  aproximar  el  valor  de  /  en  puntos  en  los  que  no  se  conoce  dicho  valor.  En  este  capítulo 
lo  utilizaremos  para  resolver  dos  problemas  clásicos  del  cálculo  numérico:  la  aproximación  de  derivadas  e 
integrales  definidas. 

Es  habitual  que  para  una  función  genérica  no  siempre  sea  posible  encontrar  una  primitiva  de  forma 
explícita;  incluso  si  es  conocida,  puede  ser  difícil  de  utilizar.  También  es  habitual  que  la  función  que  se 
quiere  integrar  o  derivar  solo  se  conozca  en  un  conjunto  discreto  de  puntos  (por  ejemplo,  cuando  representa 
los  resultados  de  mediciones  experimentales),  exactamente  como  sucede  en  el  caso  de  la  aproximación  de 
funciones.  En  ambas  situaciones  es  necesario  considerar  métodos  numéricos  para  obtener  una  aproximación 
del  valor  que  interesa,  independientemente  de  lo  difícil  que  sea  la  función  a  integrar  o  derivar.  En  estos  casos 
la  idea  básica  es  la  misma:  aproximar  la  derivada  de  una  función  en  un  punto  y  la  integral  de  una  función 
en  un  intervalo,  respectivamente,  mediante  la  derivada  de  dicho  punto  de  su  polinomio  de  interpolación  y  la 
integral  del  polinomio  de  interpolación  en  dicho  intervalo. 

En  primer  lugar,  daremos  varias  fórmulas  para  aproximar  derivadas  primeras  y  segundas  mediante  cocien¬ 
tes  de  diferencias.  En  segundo  lugar,  veremos  varios  métodos  para  aproximar  una  integral  definida  utilizando 
una  suma  ponderada  de  valores  de  la  función  en  puntos  específicos.  Comenzaremos  considerando  fórmulas 
básicas  que  utilizan  datos  uniformemente  espaciados,  cuya  exactitud  será  posteriormente  mejorada  a  partir  de 
la  subdivisión  del  intervalo  de  integración  y  la  aplicación  de  una  de  las  técnicas  básicas  en  cada  subintervalo. 
Terminaremos  presentando  una  técnica  más  potente,  la  cuadratura  gaussiana,  que  utiliza  una  colección  de 
puntos  que  son  elegidos  de  forma  que  se  obtenga  el  mejor  resultado  posible  dentro  de  una  cierta  clase  de 
funciones. 

Destacamos  que  la  aproximación  de  integrales  (una  tarea  frecuentemente  necesaria)  puede  normalmente 
llevarse  a  cabo  sin  mucho  esfuerzo  de  manera  muy  precisa,  mientras  que  la  aproximación  de  derivadas  (que 
es  mucho  menos  necesaria)  es  un  problema  más  difícil.  Véase  [7a  para  su  análisis. 

Necesitaremos  posteriormente  este  tipo  de  métodos,  cuando  aproximemos  la  soluciones  de  ecuaciones 
diferenciales  ordinarias  y  en  derivadas  parciales. 


5.2.  Derivación  numérica 

Las  aproximaciones  numéricas  de  las  derivadas  se  usan  principalmente  de  dos  maneras.  Una,  cuando 
estamos  interesados  en  calcular  el  valor  de  alguna  derivada  en  algún  punto  prefijado,  que  a  menudo  se  ha 
obtenido  empíricamente.  Dos,  las  fórmulas  de  derivación  numérica  se  usan  para  obtener  métodos  numéricos 
en  la  resolución  de  ecuaciones  diferenciales  ordinarias  y  en  derivadas  parciales. 

5.2.1.  El  problema  de  la  derivación  numérica 

Nos  planteamos  el  problema  de  aproximar  la  derivada  de  una  función  en  un  punto,  bien  porque  solo 
conocemos  una  tabla  de  valores  de  la  misma,  o  bien,  porque  la  expresión  de  la  función  es  excesivamente 
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complicada  para  intentar  obtener  una  expresión  explícita  de  su  derivada. 

Considérese  una  función  /  :  [a,  b]  — >  ffi.  continuamente  diferenciable  en  [a,b\.  En  primer  lugar,  buscamos 
una  aproximación  de  la  derivada  primera  de  /  en  un  punto  genérico  c  de  (a,  b ).  Lo  lógico  es  aprovechar  los 
valores  conocidos  de  la  función  /  para  obtener  un  valor  aproximado  de  /'(c).  Por  ejemplo,  como 


/'(c) 


lím 

h—>0 


f(c+h)  -  /(c) 
h 


si  se  conoce  el  valor  de  /  en  c  y  c  +  /i,  cuando  h  es  pequeño,  la  expresión 

f(c+h)  -  f(c) 


es  una  aproximación  de  /'(c),  véase  la  figura  5.1  Esta  es  una  fórmula  de  derivación  numérica,  que 


además  proporciona  el  valor  exacto  de  /'(c)  cuando  /  es  un  polinomio  de  grado  <  1.  Aunque  esto  puede 
parecer  trivial,  no  resulta  muy  eficaz  debido  al  error  de  redondeo.  Sin  embargo,  es  ciertamente  el  punto  de 
partida. 


h  ->  0 


Figura  5.1:  Derivada  de  una  función  en  un  punto  c  (recta  continua)  y  aproximaciones  de  la  derivada  (rectas 
discontinuas) . 


5.2.2.  Derivadas  primeras 

La  derivación  numérica  de  una  función  /  diferenciable  en  c  G  R  consta  de  dos  etapas: 

■  Construcción  del  polinomio  de  interpolación  pm  de  la  función  /  en  un  conjunto  de  nodos  Xq,  aq, . . . ,  xn 
(que  conviene  tomar  próximos  a  c). 

■  Derivación  del  polinomio  pn  y  evaluación  en  c,  según  la  fórmula  de  derivación  numérica:  f{c)  —  p'n(c). 

Las  fórmulas  así  obtenidas  reciben  el  nombre  de  fórmulas  de  derivación  interpolatorias. 

Para  el  caso  del  cálculo  de  la  derivada  primera  de  /  en  c,  se  pueden  utilizar  diferentes  números  de 

nodos.  Con  dos  nodos,  Xq  y  ii,  se  tiene  que  la  fórmula  de  Newton  del  polinomo  de  interpolación  es 


PiO)  =  o)  +  f[x 0,xi](x  -  x0 ), 

f  (x  )  f  ('X'  ) 

donde  f[xo,x i]  =  1 - — - .  Por  tanto,  la  correspondiente  fórmula  de  derivación  numérica  es 


Xi  -  x0 


f\c)^p[(c)  = 


f{x i)  -  f(x o) 
Xi  -  x0 


Es  razonable  que  los  nodos  estén  cerca  de  c.  Si,  por  ejemplo,  tomamos  xq  =  c  y  X\  =  c+  h,  con  h  ^  0,  la 
fórmula  es 
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que  se  conoce  como  diferencia  finita  progresiva  para  la  derivada  primera.  Se  puede  obtener  otra  aproxi¬ 
mación  de  /' (c)  si  tomamos  Xq  =  c  —  fe  y  x\  =  c,  con  fe  7^  0,  y  la  fórmula  correspondiente 

\  _  /(c)  -  f(c-h) 


se  denomina  entonces  diferencia  finita  regresiva  para  la  derivada  primera.  Estas  dos  últimas  aproxima¬ 
ciones  son  fórmulas  de  dos  puntos.  Si  fe  — >  0  en  ambas  fórmulas,  la  parte  derecha  tiende  a  /'(c),  puesto  que 
es  precisamente  la  definición  de  límite.  Luego,  para  fe  pequeña,  la  aproximación  anterior  es  buena  (siempre  y 
cuando  no  se  produzcan  errores  de  redondeo). 

Si  ahora  tomamos  xq  =  c  —  fe  y  X\  =  c  +  fe,  la  fórmula  resultante  es 


f(r\  ~  /(c+  fe)  -  f{c-h) 
1  U  “  2  fe 


(5.2) 


Nota.  El  grado  de  exactitud  de  una  fórmula  de  derivación  numérica  es  el  mayor  grado  de  los  polinomios  que 
son  derivables  exactamente  por  dicha  fórmula.  Se  puede  demostrar  entonces  que  el  grado  de  exactitud  de  la 
fórmula  anterior  de  dos  puntos  es  dos. 


Con  tres  nodos  xq,  x\  y  x2,  la  fórmula  de  Newton  del  polinomo  de  interpolación  es  ahora 


P2{x)  =  f(x o)  +  f[x0,  xi\(x  -  s0)  +  f[x o,  x1,x2\(x  -  x0)(x  -  aq), 


donde  /[ x0,xi,x2]  =  ^Xl,X2^ - f\fcfhfcÁ_  por  tanto, 

x2  -  x0 

f(c)  =  p'(c)  =  J(ll)  -  /(l°>  +  _  Xl)  +  _  Io) 

Xi  -  x0  x2  —  x0  x2  -  x0 

Teniendo  en  cuenta  de  nuevo  que  los  nodos  esten  próximos  a  c,  si  xo  =  c  —  fe,  X\  =  c  y  x2  =  c  +  fe,  se  tiene 

/(c+  fe)  -  /(c-  fe) 


f(c)  ~ 


2  fe 


que  coincide  con  (5.2)  y  se  conoce  como  diferencia  finita  centrada  para  la  derivada  primera  o  fórmula 
de  tres  puntos  para  el  punto  medio. 

Para  xq  =  c,  x\  =  c  +  fe.  y  x2  =  c  +  2 fe,  se  tiene 


/'(c)  ^ 


~3/(c)  +  4/(c  +  fe)  -  f(c  +  2fe) 
2fe 


conocida  como  diferencia  finita  progresiva  de  tres  puntos.  Y  si  xo  =  c  —  2 fe,  x\  =  c  —  h  y  x2  =  c, 
obtenemos 

3/(c)  —  4/(c  —  fe)  +  /(c  —  2fe) 


/'(c)  ^ 


2fe 


que  se  conoce  como  diferencia  finita  regresiva  de  tres  puntos. 

Los  métodos  anteriores  se  llaman  fórmulas  de  tres  puntos  (aunque  el  tercer  punto  /(c)  no  aparezca  en  la 
fórmula  para  el  punto  medio).  Análogamente,  existen  métodos  conocidos  como  fórmulas  de  cinco  puntos  que 
involucran  la  evaluación  de  la  función  en  dos  nodos  adicionales. 


Ejemplo.  Dada  f(x)  =  ex,  vamos  a  aproximar  /'(1.5)  mediante  las  fórmulas  anteriores  (5.1 1  y  ( 5.2  I  con 
fe  =  0.1,  y  compararemos  los  resultados  con  el  valor  exacto  f'(x)  =  e15.  Si  tomamos  x  =  1.5  y  fe  =  0.1  en 
(5.1 1  y  (5.2 1,  tenemos  respectivamente 


/'(1-5)  * 


e1'6  —  e1,5 
0T 


4.713433540571  y  /( 1.5)  ~ 


e16  —  e1'4 
(L2 


4.489162287752. 


Y  los  errores  absolutos  son  entonces 


e15 -4.7134335405711  =  0.231744 


le1'5  -4.4891622877521  =  0.007473.  □ 
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5.2.3.  Derivadas  segundas 

Podemos  generar  métodos  para  aproximar  las  derivadas  superiores  de  una  función  como  hemos  hecho  para 
aproximar  la  derivada  primera.  Por  ejemplo,  si  conocemos  la  función  /  en  los  nodos  Xo,  Xi, . . . ,  xm,  próximos  a 
c,  derivando  k  veces  el  polinomio  de  interpolación  pm  y  evaluando  en  c,  tenemos  f^k\c)  ~  k\  f[xo,x\, ,  Xk ]• 

A  continuación  vamos  a  ver  algunas  fórmulas  para  la  derivada  segunda.  Debe  haber  tres  o  más  nodos,  ya 
que  con  dos  el  polinomio  de  interpolación  p\  es  de  primer  grado,  así  que  su  derivada  segunda  es  siempre  nula 
para  toda  función  /  y  todo  punto  c. 

Con  tres  nodos  xo,  X\  y  X2 ,  la  fórmula  de  Newton  del  polinomo  de  interpolación  es 
P2{x)  =  /(x0)  +  /[x0,  X\]{x  -  X0)  +  /[x0,  Xi,  X2](x  -  X0)(x  -  Xi), 


por  lo  que 

f"(c)  ~p2(c)  =  2/[x0, Xi, x2]  =  2 
Si  xq  =  c  —  h,  X\  =  c  y  x2  =  c  +  h,  se  tiene 


f[x i,x2]  -  /[x0,xi] 


X2  -  Xq 


/"(o)  * 


f(c-h)-2f(c)  +  f(c+h) 

h2 


que  se  conoce  como  diferencia  finita  centrada  para  la  derivada  segunda  o  fórmula  de  tres  puntos  para 
aproximar  f"  en  el  punto  medio.  Si  tomamos  Xq  =  c,  x\  =  c  +  h  y  x2  =  c  +  2 h,  entonces 


f"(c)  * 

Y  si  xo  =  c  —  2 h,  Xi  =  c  —  h  y  x2  =  c, 

f"{c)  ~ 


/  (c)  —  2/(c  +  h)  +  /(c  +  2  h) 
~  ~  h2  ' 


/(c  —  2/i)  —  2f(c  —  h)  +  f  (c) 
h 2 


Finalmente,  mencionar  que  en  los  tres  casos  los  métodos  dan  el  valor  exacto  de  la  derivada  si  h  — >  0. 

Ejemplo.  Sea  /(x)  =  senx.  Aproximemos  el  valor  de  /"( 0.5)  mediante  la  diferencia  finita  centrada  con 
h  =  0.1,  y  comparémoslo  con  el  valor  real  sen(0.5)  =  —0.47942554.  Así, 

/"( 0.5)  ~  /(°~4)  ~  +  ~  -0.4790027, 


(o.i)5 


cuyo  error  absoluto  es  0.000399.  □ 


5.2.4.  El  error  en  la  derivación  numérica 

Teniendo  en  cuenta  la  expresión  del  error  de  interpolación,  es  fácil  dar  expresiones  del  error  de  derivación 
numérica,  pues  basta  con  derivar  la  fórmula  del  error  para  el  polinomio  de  interpolación.  Sin  embargo,  en  el 
caso  de  las  fórmulas  de  derivación  numérica  también  es  fácil  aprovechar  el  polinomio  de  Taylor  de  la  función 
/  para  obtener  una  expresión  del  error  de  truncamiento.  Por  ejemplo,  a  partir  de  la  fórmula 

h2 


se  deduce  que 


f(c  +h)  =  /(c)  +  hf'(c )  +  /"(O,  £  e  (c,  c  +  h), 


f{c+h)-f(c )  h„ 

/  (c) - ^ - =  -^/(0.  4G(c,c+h), 


que  da  el  error  para  la  fórmula  de  dos  puntos  (5.1 1. 
Análogamente,  restando  los  desarrollos 


f(c+h)  =  f(c)  +  hf(c )  +  ^/"(c)  +  i),  Ci  G  (c,c+  ft), 

f(c  -  h)  =  f(c )  -  hf\c)  +  yJ"{c)  -  ^r(6), 


6  e  (c-h,c), 
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se  tiene 


f(c+h)  -  f(c~  h)  h2ltll 
/(C) - 2 h - =  ~Í2(/ 


'(6)+r(6))  =  -Tr 


’(0» 


(5.3) 


donde  £  £  (c  —  h,  c  +  h),  siempre  que  f"  sea  continua  (para  poder  usar  el  teorema  del  valor  intermedio  y 
poder  deducir  entonces  que  existe  el  valor  £),  dando  lugar  así  a  la  expresión  del  error  asociado  a  la  fórmula 
de  derivación  numérica  (|5.2|).  Si  los  valores  de  /'"(£)  no  cambian  muy  rápidamente,  entonces  el  error  de 
truncamiento  tiende  a  cero  a  la  misma  velocidad  que  h2,  lo  que  expresamos  mediante  la  notación  0(h2). 

De  igual  forma  se  obtienen  expresiones  para  las  restantes  fórmulas  de  derivación  numérica,  aunque  en 
algunos  casos  no  es  posible  agrupar  todos  los  restos  de  Taylor  en  un  solo  sumando.  No  obstante,  en  todas  las 
fórmulas  de  derivación  numérica,  el  error  de  truncamiento  es  proporcional  a  una  potencia  de  h  mayor  o  igual 
que  uno. 

Es  especialmente  importante  prestar  atención  a  los  errores  de  redondeo  cuando  se  aproximan  derivadas. 
Cuando  se  aplica  una  fórmula  de  derivación  numérica,  el  error  de  truncamiento  disminuye  si  se  reduce  el 
tamaño  de  paso  h,  pero  a  costa  de  incrementar  el  error  de  redondeo.  En  la  práctica,  tomar  h  demasiado 
pequeño  no  suele  reportar  ventajas  porque  los  errores  de  redondeo  dominan  los  cálculos  (véase  la  pág.  182  de 
¡7]  para  un  ejemplo) .  Todas  las  fórmulas  de  derivación  numérica  presentan  problemas  debidos  al  redondeo  y, 
aunque  los  métodos  de  orden  superior  reduzcan  las  dificultades,  es  imposible  evitar  este  problema  enteramente. 

Hay  que  tener  en  cuenta  que,  como  método  de  aproximación,  la  derivación  numérica  es  inestable,  puesto 
que  los  valores  pequeños  de  h  que  permitirían  reducir  el  error  de  truncamiento  aumentan  los  errores  de 
redondeo.  Esto  debería  evitarse  si  fuera  posible,  pero  no  lo  es. 

El  valor  óptimo  de  h  es  el  que  minimiza  el  error  total  ET(h),  es  decir,  la  suma  de  los  errores  de  trun¬ 
camiento  Et(h)  y  de  redondeo  Er{h).  Así,  para  (5.3 1,  si  M  es  una  cota  de  la  tercera  derivada  de  /,  el  error 
total  ET(h )  verifica 


£  Mh 2 

\ET(h)\  =  | Er(h)  +  Et(h) |  <  \Er(h)\  +  \Et(h)  \  =  -  +  — , 

h  6 

donde  £  es  la  magnitud  del  error  de  redondeo  máximo  cometido  al  aproximar  /(c  —  h)  y  /(c  +  h)  con  el 
ordenador.  El  mínimo  del  miembro  de  la  derecha  se  alcanza  cuando 


Mh 


3e 


—  — ^  H - —  =  0;  es  decir,  para  h  =  \ 


h 2 


M 


Por  tanto,  este  valor  de  h  será  bueno  para  aplicar  dicha  fórmula  de  derivación  numérica,  pero  valores  mucho 
menores  que  él  pueden  conducir  a  estimaciones  pésimas  de  la  derivada. 


5.3.  Integración  numérica 

En  los  cursos  de  cálculo  se  describen  muchas  técnicas  para  evaluar  integrales  exactamente,  pero  estas 
técnicas  apenas  pueden  utilizarse  para  evaluar  integrales  que  surgen  en  los  problemas  que  se  dan  en  la 
realidad.  Las  técnicas  exactas  no  pueden  resolver  muchos  problemas  que  aparecen  en  el  mundo  físico;  para 
estos  necesitamos  métodos  de  aproximación  de  integrales.  Estos  métodos  se  llaman  genéricamente  métodos 
de  cuadratura  porque  «cuadratura»  es  la  palabra  clásica  para  denominar  el  cálculo  de  áreas. 


5.3.1.  El  problema  de  la  cuadratura  numérica 

Estudiaremos  a  continuación  métodos  para  el  cálculo  aproximado  de  integrales  de  la  forma 


f(x)  dx, 


donde  /  es  una  función  integrable  en  el  intervalo  acotado  [a,  6]. 

Ahora  describimos  tres  situaciones  en  las  que  es  necesario  calcular  aproximaciones  a  integrales  definidas. 
La  primera,  el  caso  en  el  que  la  primitiva  de  la  función  /  no  se  puede  expresar  en  términos  de  funciones 
elementales.  La  segunda  situación  se  debe  al  caso  en  que  la  primitiva  se  puede  escribir,  pero  es  tan  complicada 
que  se  desea  la  aplicación  de  un  método  de  cuadratura  para  su  evaluación  numérica.  La  tercera  situación 
se  da  cuando  el  integrando  se  conoce  solo  puntualmente;  por  ejemplo,  como  resultado  de  una  medición 
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experimental.  El  último  caso  también  aparece  cuando  se  aplican  los  métodos  de  cuadratura  al  tratamiento 
numérico  de  ecuaciones  diferenciales  o  integrales. 

Las  mismas  cuestiones  que  hemos  visto  para  f^k\c)  pueden  verse,  sin  apenas  cambios,  para  aproximar 
Jb  f{x)  dx,  donde  ay  b  son  finitos  y  /  una  función  definida  e  integrable  en  [a,  b\.  Para  ello,  aproximaremos 
/  por  un  polinomio  de  interpolación  pm  en  un  conjunto  de  nodos  Xo,  x\, . . . ,  xm  y  calcularemos  exactamente 
J  Pm(x)  dx,  de  manera  que  f  f(x)dx  ~  fa  pm(x)  dx,  obteniéndose  así  fórmulas  de  cuadratura  numérica. 
Además,  como  los  errores  de  interpolación  tienen  una  fórmula  explícita  para  las  cotas  del  error,  se  pueden 
obtener  también  cotas  del  error  para  las  fórmulas  de  cuadratura. 

Empezamos  introduciendo  algunas  fórmulas  simples  que  son  casos  particulares  de  una  familia  mayor  de 
fórmulas  de  cuadratura  conocidas  como  fórmulas  de  Newton-Cotes.  Para  un  conocimiento  más  completo  de 
esta  familia  de  fórmulas  se  puede  consultar  [T] . 

5.3.2.  Reglas  de  cuadratura  básicas 

Comenzamos  considerando  un  grupo  de  fórmulas  de  cuadratura  numérica  que  están  basadas  en  evaluacio¬ 
nes  de  funciones  en  nodos  equiespaciados.  Estas  fórmulas  se  conocen  como  fórmulas  de  Newton-Cotes.  Hay 
dos  tipos  básicos,  que  dependen  de  si  los  valores  de  la  función  en  los  extremos  del  intervalo  de  integración  se 
utilizan  o  no.  La  regla  del  punto  medio  es  el  ejemplo  más  simple  de  fórmula  de  Newton-Cotes  abierta,  en  la 
que  los  extremos  de  integración  no  se  utilizan.  Las  reglas  del  trapecio  y  de  Cavalieri-Simpson  son  ejemplos 
de  fórmulas  de  Newton-Cotes  cerradas,  en  las  que  los  extremos  de  integración  se  utilizan. 

El  caso  más  simple  que  se  puede  dar  es  cuando  solo  se  utiliza  un  nodo,  Xq.  En  este  caso,  po(x)  =  f(x o), 
por  lo  que  la  integral  en  el  intervalo  [a,  b]  se  aproxima  por 

nb  rb  rb 

/  f{x)  dx  ~  /  po(x)  dx  =  /  f(x0)dx  =  (b-  a)f(x0). 

Ja  Ja  Ja 

Gráficamente,  si  /  es  no  negativa,  lo  que  se  hace  es  aproximar  el  área  bajo  la  curva  y  =  /(a;),  comprendida 
entre  x  =  a  y  x  =  b,  por  el  área  del  rectángulo  de  base  b  —  a  y  altura  f(x o).  Las  elecciones  más  usuales  son 
Xo  =  a,  Xq  =  b  y  Xq  =  ■  En  el  primer  y  segundo  caso  las  fórmulas  de  cuadratura  se  llaman  respectivamente 

regla  del  rectángulo  a  izquierda  y  regla  del  rectángulo  a  derecha.  En  el  último  casos  la  fórmula  de 
cuadratura  se  llama  regla  del  punto  medio.  En  la  figura [572]  pueden  verse  las  interpretaciones  geométricas 
de  estas  tres  reglas. 


y  V  =  /(a 0  y  V  =  f(x)  y  y  =  f(x) 


Figura  5.2:  Regla  del  rectángulo  a  izquierda,  regla  del  rectángulo  a  derecha  y  regla  del  punto  medio. 


El  error  para  la  regla  del  punto  medio  viene  dado  por  la  integral  de  la  fórmula  del  error  para  el  polinomio 
de  interpolación  po .  Puede  probarse,  véase  [7],  que  el  error  (de  truncamiento  local)  de  esta  regla  de  cuadratura 
es:  EPM  =  *  ^  ( b  —  a)3,  donde  £  G  (a,  b),  siempre  que  /  G  C2[a,  b\. 

Si  ahora  utilizamos  dos  nodos,  xq  y  x±,  el  polinomio  de  interpolación  es 

Pi(x)  =  f(x0)  +  f[x0,xi](x  -  Xo). 

Por  tanto  la  correspondiente  fórmula  de  cuadratura  será 

Ja  f  (x)  dx  ~  Jbp!(x)dx 

=  Ja  (f(xo)  +  f[xO,Xl](x  -  Xo))  dx 

=  (i,  -  q) /(»„)  +  /(ll)  ~  ¡M  ( (b  ~  10)2  -  (°  -  . 

—  Xo  \  2  2  ) 
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Si  *0  =  a  y  X\  =  b,  se  obtiene 


J  f(x)  dx  ~  b-^  (/(a)  +  f(b)), 

conocida  como  regla  del  trapecio.  Geométricamente  la  regla  del  trapecio  es  equivalente  a  aproximar  el  área 


del  trapecio  bajo  la  recta  que  une  f{a)  y  f(b),  como  puede  verse  en  la  figura  5.3 


V  =  f(x) 


Figura  5.3:  Regla  del  trapecio. 


La  expresión  del  error  de  la  aproximación  de  la  integral  es  (véase  [7]):  Et  =  ( b  —  a)3,  donde 

£  £  (a,  b),  siempre  que  /  £  C2[a,  b\. 

Cuando  consideramos  tres  nodos  Xq,  X\  y  X2 ,  se  tiene  una  de  las  fórmulas  más  importantes,  la  regla 
de  Cavalieri-Simpson,  que  es  la  que  corresponde  a  x0  =  a,  X\  =  y  x2  =  b.  Si  p2  es  el  polinomo  de 
interpolación  en  estos  puntos,  entonces 

J  f(x)dx~J  p2(x)dx=  b—^-  ^/(a)+4/  +  f(b)^j  . 


Geométricamente  la  regla  de  Cavalieri-Simpson  es  equivalente  a  aproximar  el  área  de  la  figura  bajo  la  parábola 


que  pasa  por  /(a),  /  i 


y  /(£>),  como  puede  verse  en  la  figura 


5.4 


V  =  f(x) 


El  término  de  error  para  esta  regla  es:  Es  =  —  ^28gg^  (b  —  a)5,  donde  £  £  (a,  b ),  siempre  que  /  £  C4[a ,  b\ 
(véase  [25]). 

Ejemplo.  Para  encontrar  una  aproximación  de  JQ3  a;2  ex  dx  mediante  la  regla  de  Cavalieri-Simpson,  basta 
con 

x2  ex  dx  ~  ^  (/(O)  +  4/(1. 5)  +  /( 3))  «  110.55252.  □ 

Nota.  El  grado  de  exactitud  de  una  fórmula  de  cuadratura  es  el  mayor  grado  de  los  polinomios  que  son 
integrados  exactamente  por  dicha  fórmula.  Se  puede  demostrar  entonces  que  es  uno  para  las  reglas  del  punto 
medio  y  del  trapecio,  y  tres  para  la  regla  de  Cavalieri-Simpson. 
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Comentario  ADICIONAL.  >  En  todas  las  fórmulas  anteriores,  el  error  es  proporcional  a  una  potencia  de 
la  longitud  del  intervalo  (b  —  a).  Por  tanto,  si  el  intervalo  es  pequeño,  podemos  esperar  que  el  error 
sea  pequeño,  pero  si  es  grande,  no  tenemos  esa  garantía.  Obsérvese  también  que  la  elevada  potencia 
de  {b  —  a)  en  la  fórmula  del  error  de  la  regla  de  Cavalieri-Simpson  hace  que  ésta  sea  significativamente 
mejor  que  las  reglas  del  punto  medio  y  del  trapecio,  siempre  que  b  —  a  sea  pequeño.  Una  ilustración  de 
esto  último  puede  verse  en  el  ejemplo  1  de  la  pág.  123  de  [7j. 


5.3.3.  Reglas  de  cuadratura  compuestas 

En  la  sección  anterior  hemos  tratado  las  nociones  básicas  que  sustentan  la  integración  numérica,  pero  las 
técnicas  que  hemos  estudiado  no  son  satisfactorias  en  muchos  problemas.  La  hipótesis  de  que  el  intervalo 
sea  pequeño  para  esperar  un  error  pequeño  podría  ser  muy  poco  razonable.  No  hay  motivo,  en  general,  para 
suponer  que  el  intervalo  [a,  6]  sobre  el  que  se  integra  es  pequeño  y,  si  no  lo  es,  la  elevada  potencia  de  ( b  —  a) 
en  la  fórmula  del  error  dominará,  probablemente,  los  cálculos. 

Resolveremos  el  problema  de  un  intervalo  de  integración  grande  [a,  b]  subdividiéndolo  en  una  colección 
de  intervalos  que  sean  lo  suficientemente  pequeños  para  que  podamos  mantener  bajo  control  el  error  en  cada 
uno  de  ellos.  Al  sumar  todos  los  resultados  parciales  se  obtiene  una  fórmula  de  aproximación  de  la  integral 
en  [a,  b],  dando  lugar  así  a  las  llamadas  reglas  de  cuadratura  compuestas.  El  error  en  las  fórmulas  de 
cuadratura  compuestas  es  entonces  la  suma  de  los  errores  de  las  fórmulas  simples  usadas  en  los  subintervalos 
en  los  que  se  ha  dividido  [a,  b\. 

Un  método  de  cuadratura  compuesto  consiste  en  dividir  el  intervalo  [a,  b]  en  n  subintervalos  [a;,,  a;¿+i] 
(i  =  0, 1, . . . ,  n  —  1)  tal  que 

pb  n~  1  pXi+i 

/  f(x)  dx  =  /  f(x)  dx’ 

Jo,  i=o  J* i 

y  aproximar  ahora  cada  una  de  las  integrales  Jx‘+1  f(x )  dx  mediante  una  fórmula  de  cuadratura  básica. 

Por  ejemplo,  si  desomponemos  el  intervalo  de  integración  en  n  subintervalos  iguales  mediante  una  partición 
uniforme  del  mismo,  con  nodos  Xi  =  a  +  ih,  i  =  0, 1, . . . ,  n,  h  =  y,  en  cada  subintervalo,  aproximamos 
por  la  fórmula  del  trapecio 


J  f(x)  dx  ~  ^tf(xi)  +  f{xi+ 1)), 


i  =  0, 1, . . . ,  n  —  1, 


se  obtiene  la  regla  del  trapecio  compuesta  para  n  subintervalos 

,  n-r  ,  /  n—1  \ 

f(x)  dx  ~  -  ^2(f(xi)  +  f(xi+ O)  =  -  f{a)  +  f(b)  +  2  ^  f(xi )  J  , 

*= o  V  i=l  / 

donde  el  error  cometido  viene  dado  por  Etc  =  ~  aX  con  £  e  (a,  b),  siempre  que  /  G  C2[a,  b\. 

El  orden  de  convergencia  de  la  regla  del  trapecio  compuesta  es  entonces  0(h 2),  así  que  las  aproximaciones 
convergen  a  J  f(x)  dx  aproximadamente  a  la  misma  velocidad  que  h2  — >  0. 

Ejemplo.  Utilizamos  ahora  la  regla  del  trapecio  compuesta  con  n  =  2  para  aproximar  la  integral  x2  ex  dx. 
Así,  h  =  3/2  y 

x2ex  dx  ~  H  (/(O)  +  /( 3))  +  |/(1.5)  «  150.70307. 

Notemos  que  el  valor  exacto  de  la  integral  anterior  es  5e3  — 2  ss  98.42768.  Luego,  se  ha  obtenido  una  apro¬ 
ximación  peor  que  la  dada  anteriormente  por  la  regla  de  Cavalieri-Simpson  (véase  el  ejemplo  anterior).  Esto 
es  debido  a  que  no  hemos  tomado  el  número  suficiente  de  trapecios  para  obtener  una  mejor  aproximación. 
¿Cuántos  se  deberían  tomar  entonces?  A  menudo,  se  calcula  la  integral  varias  veces  incrementando  el  número 
de  trapecios  cada  vez,  y  se  para  cuando  la  diferencia  entre  dos  respuestas  sucesivas  es  satisfactoriamente 
pequeña.  □ 

Comentarios  ADICIONALES.  >  El  esquema  de  subdivisiones  empleado  anteriormente  se  puede  aplicar 
con  cualquiera  de  las  reglas  vistas  en  la  sección  anterior,  dando  lugar  así  a  las  correspondientes  reglas 
del  punto  medio  compuesta  y  de  Cavalieri-Simpson  compuesta.  El  orden  de  convergencia  de  estas  dos 
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reglas  es  respectivamente  0(h2)  y  0(h4).  Esto  prueba  que  el  error  de  la  regla  de  Cavalieri-Simpson 
tiende  a  cero  más  rápidamente  que  el  error  de  las  reglas  del  punto  medio  y  del  trapecio  cuando  h  — >  0. 
Esta  velocidad  de  convergencia  es  suficiente  para  la  mayoría  de  los  problemas  habituales,  suponiendo 
que  el  intervalo  de  integración  se  divide  de  manera  que  h  sea  pequeño. 

>  Una  propiedad  importante  que  comparten  todas  las  reglas  compuestas  es  su  estabilidad  con  respecto  a 
los  errores  de  redondeo.  Véase  la  pág.  134  de  [3  para  la  regla  de  Cavalieri-Simpson  compuesta. 

>  Si  n  es  grande,  los  intervalos  de  integración  son  pequeños,  con  lo  cual  se  espera  que  el  error 

cometido,  al  aplicar  una  regla  de  cuadratura  en  cada  uno  de  estos  intervalos,  sea  pequeño,  siendo  el 
error  total  la  suma  de  los  errores  cometidos  en  cada  intervalo  de  integración.  Se  puede  demostrar  que 
si  n  — *  oo,  el  error  tiende  a  0. 

5.3.4.  Cuadratura  gaussiana 

Las  reglas  de  cuadratura  básicas  se  han  construido  integrando  polinomios  de  interpolación.  La  fórmula 
del  error  del  polinomio  de  interpolación  de  grado  m  contiene  la  derivada  de  orden  m  +  1  de  la  función  a 
aproximar.  Puesto  que  la  derivada  (m+  l)-ésima  de  todo  polinomio  de  grado  <  mes  cero,  al  aplicar  fórmulas 
de  este  tipo  a  dichos  polinomios,  obtenemos  un  resultado  exacto. 

Todas  las  reglas  de  cuadratura  básicas  utilizan  valores  de  la  función  en  puntos  igualmente  espaciados. 
Esto  resulta  conveniente  a  la  hora  de  combinar  las  fórmulas  para  generar  las  reglas  compuestas,  pero  esta 
restricción  puede  disminuir  significativamente  la  exactitud  de  la  aproximación.  Véase  la  pág.  146  de  [7]  para 
un  ejemplo  con  la  regla  del  trapecio. 

Además,  las  reglas  de  cuadratura  básicas  son  ejemplos  de  una  fórmula  de  cuadratura  más  general  de  la 
forma: 

/b  rn 

f(x)  dx  ~  y ^Wjf(xj). 

1=0 

Los  números  reales  {w¿}  son  los  pesos  de  cuadratura ,  mientras  que  los  puntos  {xí}  son  los  nodos  de  cuadra¬ 
tura.  En  la  cuadratura  gaussiana  se  consideran  fórmulas  de  integración  numérica  como  la  anterior,  pero 
utilizando  nodos  que  no  están  igualmente  espaciados  en  el  intervalo;  se  eligen  los  nodos  {.t,}  en  el  intervalo 
[a,  6]  y  los  pesos  {w,  }  de  manera  que  se  minimice  el  error  que  se  espera  obtener  en  la  aproximación.  Para 
minimizar  este  error  esperable,  vamos  a  suponer  que  la  mejor  elección  de  estos  valores  es  la  que  produce 
resultados  exactos  para  una  clase  más  amplia  de  polinomios.  Una  elección  adecuada  de  los  m  +  1  nodos 
proporciona  fórmulas  de  cuadratura  numérica  exactas  para  polinomios  de  grado  <  2 m  +  1,  dando  lugar  así 
a  las  fórmulas  de  cuadratura  gaussiana. 

Los  pesos  {ic¿}  de  la  fórmula  anterior  son  arbitrarios  y  la  única  restricción  sobre  los  nodos  {a;¿}  es  que 
deben  estar  en  el  intervalo  de  integración  [a,  b\.  Esto  da  2 (m  +  1)  parámetros  a  elegir.  Si  ahora  imponemos 
que  sea  exacta  para  los  polinomios  1,  x,  x2, . . . ,  x2m+1  (que  son  polinomios  de  grado  <  2 m  +  1),  obtenemos, 
mediante  el  método  de  los  coeficientes  indeterminados,  un  sistema  no  lineal  de  2 (m  +  1)  ecuaciones  con 
2 (m  +  1)  incógnitas.  Este  sistema  se  puede  resolver  utilizando,  por  ejemplo,  el  método  de  Newton  para 
sistemas  de  ecuaciones  no  lineales,  o  bien,  convirtiéndolo,  mediante  ciertas  transformaciones,  en  un  sistema 
lineal  y  resolver  éste  con  las  técnicas  correspondientes. 

La  utilización  del  método  de  los  coeficientes  indeterminados  no  resulta  práctica  para  obtener  fórmulas 
de  cuadratura  con  grado  de  exactitud  superior.  Hay  un  método  alternativo  para  obtener  más  fácilmente  los 
nodos  y  los  pesos  de  estas  fórmulas  que  dan  resultado  exacto  para  polinomios  de  grado  superior.  Se  consideran 
familias  de  polinomios  especiales,  llamados  polinomios  ortogonales ,  que  tienen  la  propiedad  de  que  una  cierta 
integral  definida  del  producto  de  dos  polinomios  ortogonales  cualesquiera  de  la  familia  es  cero. 

La  familia  relevante  para  nuestro  problema  es  la  de  los  polinomios  de  Legendre  en  el  intervalo  [—1,1]. 
Estos  polinomios  pueden  calcularse  recursivamente  mediante  la  siguiente  relación  de  tres  términos 


L0(x)  =  1,  L  1(x)  =  x, 

Lk+í(x)  =  jrf±xLk(x)  -  x),  k  =  1,2, ... 

Todo  polinomio  de  grado  <  m,  para  cada  m  >  0,  se  puede  obtener  mediante  una  combinación  lineal  de  los 
polinomio  Lo,  L i, . . . ,  Lm.  El  máximo  grado  de  exactitud  es  2m+ 1  y  se  obtiene  para  la  llamada  cuadratura 
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de  Gauss-Legendre,  cuyos  nodos  y  pesos  están  dados  por 


Xi  =  ceros  de  Lm+i{x), 

2 

Wi~  (l-^XL^te))2’ 


0,1 ,m. 


Los  pesos  {w,}  son  todos  positivos  y  los  nodos  {x¿}  son  interiores  al  intervalo  (—1,1).  En 
recogen  los  nodos  y  pesos  de  las  reglas  de  cuadratura  de  Gauss-Legendre  con  m  =  1,2, 3, 4. 
puede  consultar  [T3¡.  Si  /  €  (C(2m+2)([—  1, 1]);  el  correspondiente  error  es  (véase  (233): 


la  tabla  5.1 


se 


Para  m  >  5  se 


Egl 


22m+3((TO+i)!)4 

(2to  +  3)((2m  +  2)!)3  ^ 


con  £  €  (—1, 1). 


m 

{Xi} 

{<+} 

i 

±1/73 

1 

2 

±715/5 

5/9 

0 

8/9 

3 

±¿7525  +  70730 

(18  -  730)  /36 

±¿7525  -  70730 

(18  +  730)  /36 

4 

±¿7245  +  14770 

(322  -  13770)  /900 

±¿7245-  14770 

(322  +  13770)  /900 

0 

128/225 

Tabla  5.1:  Nodos  y  pesos  para  algunas  fórmulas  de  cuadratura  de  Gauss-Legendre  sobre  el  intervalo  (—1, 1). 
Los  pesos  correspondientes  a  pares  simétricos  de  nodos  se  incluyen  solo  una  vez. 


Esto  completa  la  solución  del  problema  de  aproximación  de  integrales  definidas  para  funciones  en  el 
intervalo  [—1,1].  Ahora  bien,  esta  solución  es  suficiente  para  cualquier  intervalo  cerrado  porque  la  sencilla 
relación  lineal 


t  = 


2  x  —  a  —  b 
b  —  a 


<+> 


x  = 


b  —  a 
2 


t  + 


b  +  a 
2 


transforma  la  variable  x  del  intervalo  [a,  b]  en  la  variable  t  del  intervalo  [—1,1].  Entonces,  podemos  utilizar 
los  polinomios  de  Legendre  para  aproximar 


f(x)  dx 


dt. 


Ejemplo.  Calculemos  ahora  un  valor  aproximado  de  la  integral  JQ3  x2  ex  dx  mediante  la  cuadratura  de  Gauss- 
Legendre  con  m  =  2.  En  primer  lugar,  transformamos  la  variable  x  del  intervalo  [0,  3]  en  la  variable  t  del 
intervalo  [—1,1],  de  manera  que 

x=^(t  +  l)  y  f(x)dx=^  j  J  Qfa+l))  dt=^  j  ^g(t)dt, 


donde  g(t)  =  /(|(t  +  l))  =  | (t  +  l)2e3^í+1^/2.  Por  tanto,  ya  podemos  utilizar  los  polinomios  de  Legendre 
para  aproximar 


f(x)  dx 


+  ,9(0)+gS 


98.15460. 


Obsérvese  que  hemos  obtenido  así  una  mejor  aproximación  que  las  dadas  anteriormente  por  las  reglas  de 
Cavalieri-Simpson  y  del  trapecio  compuesta.  □ 
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Comentarios  adicionales.  >  Para  problemas  pequeños,  la  regla  de  Cavalieri-Simpson  compuesta  pue¬ 
de  ser  aceptable  para  evitar  la  complejidad  de  los  cálculos  de  las  fórmulas  de  cuadratura  gaussiana. 
Sin  embargo,  para  problemas  que  requieran  evaluaciones  de  funciones  complicadas  o  realizar  muchas 
evaluaciones  de  la  integral,  la  eficiencia  de  la  cuadratura  gaussiana  tiene  una  gran  ventaja. 

>  Las  fórmulas  de  cuadratura  gaussiana  son  particularmente  importantes  para  aproximar  integrales  múl¬ 
tiples,  ya  que  el  número  de  evaluaciones  de  la  función  crece  como  una  potencia  del  número  de  integrales 
que  se  deben  realizar.  Véase  [7¡. 

t>  La  cuadratura  gaussiana  no  es  apropiada  cuando  no  se  conoce  la  función  porque  requiere  de  evaluaciones 
de  la  función  en  puntos  irregularmente  espaciados  dentro  del  intervalo  de  integración.  Por  ejemplo,  si 
el  problema  tiene  los  datos  tabulados,  será  necesario  primero  interpolar  para  los  nodos  considerados. 

5.4.  Sugerencias  para  seguir  leyendo 

Un  texto  muy  interesante  sobre  cuadratura  numérica  es  Davis  y  Rabinowitz  (2007).  Para  las  fórmulas 
básicas  se  pueden  consultar  [T5]  Atkinson  (1989)  o  Ralston  y  Rabinowitz  (2001). 

5.5.  Ejercicios 

1.  Sean  f(x)  =  xex  y 


X  i 

1.8 

1.9 

2.0 

2.1 

2.2 

/0¿) 

10.88936 

12.70319 

14.77811 

17.14896 

19.85503 

a)  Calcúlese  f'(x),  evalúese  f'( 2.0)  y  aproxímese  /'(2.0)  mediante  fórmulas  de  2  y  3  puntos.  ¿Qué 
fórmula  obtiene  mejor  aproximación?  ¿Por  qué? 

b)  Calcúlese  f"(x),  evalúese  /"( 2.0)  y  aproxímese  /"( 2.0)  mediante  fórmulas  de  3  puntos.  ¿Qué 
fórmula  obtiene  mejor  aproximación?  ¿Por  qué? 

2.  a)  Demuéstrese  que  la  diferencia  finita  centrada  para  la  primera  derivada  es  exacta  para  polinomios 

de  grado  <  2,  mientras  que  las  diferencias  finitas  progresiva  y  regresiva  de  tres  puntos  son  exactas 
para  polinomios  de  grado  <  3. 

b)  Demuéstrese  que  la  diferencia  finita  centrada  para  la  segunda  derivada  es  exacta  para  polinomios 
de  grado  <  3,  mientras  que  las  otras  dos  diferencias  finitas  presentadas  en  el  texto  son  exactas 
para  polinomios  de  grado  <  2. 

3.  Calcúlense  los  valores  de  a ,  b,  c  para  que  la  fórmula  de  derivación  numérica 

f{x)  ~  i(a/(x  +  h)  +  bf(x)  -  c/( x  -  h)) 
sea  exacta  para  polinomios  del  mayor  grado  posible. 

4.  Fórmula  de  cinco  puntos  para  el  punto  medio.  Demuéstrese,  a  partir  de  los  cinco  nodos  c  —  2h,  c  —  h, 
c,  c  +  h  y  c  +  2 h,  que  se  puede  obtener  la  siguiente  fórmula  de  derivación  numérica  para  la  derivada 
primera 

tu  ^  /(c  -  2 h)  -  8/(c  -h)  +  8/(c  +  h)  -  f(c  +  2 h) 

1  w  = - m - ' 

y  que  es  exacta  para  polinomios  de  grado  <  4. 

5.  Obténgase  una  fórmula  de  diferencias  finitas  para  aproximar  f"{x)  en  los  puntos  c—h,  c  y  c+2h.  ¿Cuál 
es  su  grado  de  exactitud? 

6.  Derivación  parcial  numérica.  Teniendo  en  cuenta  que  la  derivada  parcial  j£.(x.  y)  de  f(x,  y)  con  respecto 
a  x  se  calcula  derivando  con  respecto  a  ir  y  manteniendo  fija  y ,  y  que  la  derivada  parcial  jJ-(x,y)  de 
/( x,  y)  con  respecto  a.  y  se  hace  derivando  con  respecto  a  y  y  manteniendo  fija  x,  todas  las  fórmulas  de 
diferencias  finitas  vistas  a  lo  largo  del  capítulo  se  pueden  adaptar  para  aproximar  derivadas  parciales. 
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Adáptase  entonces  la  fórmula  (5.2 1  para  calcular  las  derivadas  parciales  y)  y 


dx ' 

las  nuevas  fórmulas  a  f{x,y)  =  para  aproximar  fj(4, 5)  y  g^(4,5)  con  h 
Compárense  los  resultados  obtenidos  con  los  valores  exactos. 


(x,  y)  y  apliqúense 
=  0.1  y  h  =  0.01. 


7.  Obténgase  la  regla  de  Cavalieri-Simpson. 

8.  Demuéstrese  que  las  reglas  del  punto  medio  y  del  trapecio  son  exactas  para  polinomios  de  grado  <  1  y 
que  la  regla  de  Cavalieri-Simpson  lo  es  para  polinomios  de  grado  <  3. 

9.  Determínese  si  la  fórmula  de  Cavalieri-Simpson  es  exacta  para  las  funciones  p(x)  +  asenx,  donde  p(x) 
es  un  polinomio  de  grado  <  3  y  a  €  R,  en  el  intervalo  [— 7r,  7t]  . 

10.  La  solución  aproximada  de  la  integral: 

í1 

/  ex  dx 

J  o 

es  1.46265.  Calcúlese  una  aproximación  de  la  integral  dividiendo  el  intervalo  de  integración  en  cuatro 
subintervalos  iguales  y  utilizando  las  reglas  del  punto  medio,  del  trapecio  y  de  Cavalieri-Simpson. 
Compárense  los  resultados. 


11.  Determínense  los  valores  w,  xq  y  X\  para  que  la  fórmula  de  cuadratura  numérica 


f(x)  dx 


w{f{x  o)  +  f(x  i)) 


sea  exacta  para  polinomios  del  mayor  grado  posible.  Utilícese  la  fórmula  anterior  para  aproximar  el 
valor  de  las  siguientes  dos  integrales 


i 


dx 


y 


dx. 


12.  Calcúlense  los  pesos  (i  =  0, 1, 2, 3)  de  manera  que  la  fórmula  de  cuadratura  numérica 

J  /(x)  eos  xdx  ~  w0f  +wi  f  (-0  +  w2f  (0  +w3f 

sea  exacta  para  polinomios  del  mayor  grado  posible. 

13.  Determínense  los  valores  wq,  wi,  x3  y  X\  para  que  la  fórmula  de  cuadratura  numérica 

J  f(x){l  +  x2)dx~w0f(xo)  +  w1f(x1) 


sea  exacta  para  polinomios  del  mayor  grado  posible.  Apliqúese  la  fórmula  a  f(x)  =  2x2. 

14.  La  solución  aproximada  de  la  integral: 


cosx 


l-i  Vi  —  ■ 


dx 


es  2.40394.  Calcúlese  una  aproximación  mediante  la  fórmula  de  Gauss-Legendre  con  m  =  2  y  m  =  4. 
Compárense  los  resultados. 


15.  Calcúlese  una  aproximación  de  la  integral  del  ejercicio  10,  transformando  previamente  el  intervalo  de 
integración,  mediante  la  fórmula  de  Gauss-Legendre  con  m  =  2  y  m  =  4.  Compárense  los  resultados. 

16.  Obténgase  la  fórmula  de  cuadratura  de  Gauss-Legendre  de  dos  puntos  (m  =  1)  utilizando  el  método  de 
los  coeficientes  indeterminados  y  la  exactitud  de  la  fórmula. 


Capítulo  6 


Resolución  numérica  de  problemas  de 
valor  inicial 

6.1.  Introducción 


Una  ecuación  diferencial  es  una  ecuación  en  la  que  aparece  una  o  más  derivadas  de  una  función  desco¬ 
nocida.  Si  todas  las  derivadas  se  toman  con  respecto  a  una  sola  variable  independiente  se  llama  ecuación 
diferencial  ordinaria  (abreviadamente,  EDO),  mientras  que  hablaremos  de  una  ecuación  en  derivadas  par¬ 
ciales  (abreviadamente,  EDP)  cuando  aparecen  derivadas  parciales  en  la  ecuación.  Una  ecuación  diferencial 
(EDO  o  EDP)  tiene  orden  q  si  q  es  el  máximo  orden  de  derivación  que  aparece  en  la  ecuación.  En  este  capítulo 
nos  centraremos  únicamente  en  las  EDO  de  primer  orden. 

Las  EDO  modelizan  una  gran  cantidad  de  fenómenos  en  diversos  campos.  En  muchas  situaciones  reales 
un  problema  está  modelizado  por  una  EDO  que  requiere  del  cálculo  de  la  solución  de  un  problema  de  valor 
inicial  (abreviadamente,  PVI);  esto  es,  la  solución  de  una  EDO  que  verifica  una  condición  inicial  dada. 
Frecuentemente  el  PVI  es  demasiado  complicado  como  para  que  se  pueda  resolver  exactamente,  de  manera 
que  se  emplea  entonces  una  de  dos  posibles  técnicas  para  aproximar  su  solución.  La  primera  técnica  consiste 
en  simplificar  la  EDO,  obteniendo  otra  que  pueda  resolverse  exactamente,  y  usar  después  la  solución  de  la 
ecuación  simplificada  como  aproximación  de  la  solución  de  la  ecuación  original.  La  otra  técnica,  que  es  la  que 
trataremos  aquí,  consiste  en  construir  métodos  que  aproximen  directamente  la  solución  del  problema  original. 

Los  métodos  que  consideraremos  no  proporcionan  una  aproximación  continua  a  la  solución  del  PVI, 
sino  aproximaciones  del  valor  de  la  solución  en  un  conjunto  de  puntos  que  habitualmente  están  igualmente 
espaciados,  de  manera  que  será  necesario  utilizar  algún  tipo  de  interpolación  cuando  se  necesiten  valores 
intermedios.  Las  fórmulas  de  diferenciación  numérica  presentadas  en  el  capítulo  anterior  juegan  un  papel 
fundamental  en  la  construcción  de  estos  métodos. 

Los  métodos  de  resolución  que  presentamos  son  increméntales,  de  manera  que  la  solución  se  determina 
en  un  número  de  pasos.  Empiezan  en  el  punto  en  el  que  está  dada  la  condición  inicial.  Después,  utilizando  la 
aproximación  de  la  solución  conocida  en  el  primer  punto,  se  determina  una  aproximación  de  la  solución  en  un 
segundo  punto  más  cercano.  A  continuación,  se  determina  la  aproximación  de  la  solución  en  un  tercer  punto, 
y  así  sucesivamente.  Existen  métodos  de  un  paso  y  de  varios  pasos  (multipaso) .  En  los  métodos  de  un  paso  se 
aproxima  la  solución  a  partir  de  la  aproximación  en  el  paso  anterior,  mientras  que  en  los  métodos  multipaso 
la  solución  se  aproxima  a  partir  de  aproximaciones  conocidas  en  varios  pasos  anteriores.  El  interés  de  los 
métodos  multipaso  es  que  el  conocimiento  del  valor  de  la  función  en  varios  puntos  anteriores  puede  dar  una 
mejor  estimación  de  la  tendencia  de  la  solución.  Para  aproximar  la  solución  en  cada  paso  también  se  pueden 
utilizar  dos  tipos  de  métodos:  métodos  explícitos  y  métodos  implícitos.  Los  segundos  suelen  proporcionar 
mejor  exactitud  que  los  primeros,  pero  requieren  de  un  mayor  esfuerzo  computacional  en  cada  paso. 

Limitaremos  nuestro  estudio  a  EDO  de  primer  orden,  dado  que  una  ecuación  de  orden  q  >  1  siempre  se 
puede  reducir  a  un  sistema  de  q  ecuaciones  de  primer  orden.  El  caso  de  sistemas  de  primer  orden  se  tratará 
a  continuación. 
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6.2.  El  problema  de  Cauchy 

Una  EDO  admite,  en  general,  un  número  infinito  de  soluciones.  Para  fijar  una  de  ellas,  debemos  imponer 
una  condición  adicional  que  dée  el  valor  tomado  por  esta  solución  en  un  punto  dado  del  intervalo  de  integra¬ 
ción.  Por  ejemplo,  la  ecuación  y'(t)  =  C\(y  —  C2)  admite  la  familia  de  soluciones  y(t)  =  C2  +  K eClt ,  donde 
K  es  una  constante  arbitraria.  Si  imponemos  la  condición  y( 0)  =  1,  escogemos  entonces  la  única  solución 
correspondiente  al  valor  K  =  1  —  C2. 

El  problema  de  Cauchy,  también  llamado  problema  de  valor  inicial,  consiste  en  encontrar  la  función 
solución  de  una  EDO  que  satisfaga  una  condición  inicial  dada,  y  toma  la  siguiente  forma: 

Encuéntrese  una  función  real  y  :  [a,  b]  — >  R.  tal  que 

y'(t)  =  f(t,y(t)),  para  todo  t  €  [a,  6],  con  y  (a)  =  y0,  (6.1) 

donde  [a,  b]  es  un  intervalo  de  K,  /  :  [a,  b]  x  R  — >  ffi.  es  una  función  dada  e  y0  es  un  valor  dado  que 
se  llama  dato  inicial. 


Antes  de  describir  los  métodos  para  aproximar  la  solución  de  nuestro  problema  básico,  consideraremos 
algunas  condiciones  que  garanticen  que  exista  una  solución.  De  hecho,  puesto  que  no  resolveremos  el  proble¬ 
ma  dado,  sino  solo  una  aproximación  de  él,  necesitamos  saber  cuando  un  problema  cercano  al  dado  posee 
soluciones  que  se  aproximan  con  precisión  a  la  solución  del  problema  original.  Cuando  un  PVI  posee  esta 
propiedad  se  dice  que  está  bien  planteado,  siendo  éstos  son  los  problemas  para  los  que  son  adecuados  los  mé¬ 
todos  numéricos.  La  siguiente  condición  de  buen  planteamiento  establece  que  la  clase  de  los  problemas 
bien  planteados  es  bastante  amplia: 


Supongamos  que  /  y  fy,  su  derivada  parcial  con  respecto  a  y,  son  continuas  para  todo  t  £  [a,  b]  y 
para  todo  y.  Entonces,  el  problema  de  Cauchy  (6.1)  tiene  solución  única  y  =  y(t)  para  t  £  [a,  b] 
y  es  un  problema  bien  planteado. 


La  estrategia  común  de  los  métodos  numéricos  capaces  de  aproximar  la  solución  de  cada  EDO  para  la  que 
existe  solución  consiste  en  subdividir  el  intervalo  de  integración  [a,  b]  en  N  intervalos  de  longitud  h  =  —j ^ ; 
h  se  llama  paso  de  discretización  o  tamaño  de  paso.  Entonces,  en  cada  nodo  ti  =  a  +  ih  (i  =  0, 1, ... ,  N), 
buscamos  el  valor  desconocido  que  aproxima  a  yt  —  y  (ti).  El  conjunto  de  valores  {i¿o  =  yo,  u\, . . . ,  ujy}  es 
la  solución  numérica  buscada. 


6.3.  Métodos  de  Taylor 


Muchos  de  los  métodos  numéricos  vistos  hasta  ahora  se  derivan  en  el  fondo  del  Teorema  de  Taylor.  La 
aproximación  de  la  solución  de  un  PVI  no  es  una  excepción.  En  este  caso,  la  función  que  expresaremos  en 
términos  de  su  polinomio  de  Taylor  es  la  solución  (desconocida)  del  problema  y(t).  Su  forma  más  elemental 
(polinomio  de  Taylor  con  n  =  1)  conduce  al  método  de  Euler  explícito,  que  genera  una  solución  numérica 
como  la  que  sigue: 

u0  =  yo ,  u*+i  =  uí  +  hf(ti,  uí),  i  =  0,1,...,  N-  1, 


aproximándose  así  la  EDO  por  una  ecuación  en  diferencias.  Algebraicamente  este  método  se  puede  obtener 
considerando  la  EDO  (6.1 1  en  cada  nodo  i  =  1,2, ...  ,N,  reemplazando  la  derivada  exacta  y' (ti)  por  la 
diferencia  finita  progresiva  ^(z/(t¿+ 1)  —  y  (ti))  y  construyéndose  la  aproximación  m  de  y  (ti)  para  cada  i  = 
1.2.....  N. 


Una  interpretación  geométrica  de  este  método  está  dada  en  la  figura  [671] y  se  puede  explicar  como  sigue. 
Supongamos  que  hemos  encontrado  z¿¿  en  t  =  ti.  La  ecuación  de  la  recta  tangente  a  la  gráfica  de  y(t)  en  t  =  U 
es  y  —  Ui  =  m(t  —  ti),  donde  m  =  y1  (ti)  =  f(U,  uf).  Para  t  =  1  e  y  =  1,  tenemos  1  —  =  m(U+ 1  —  ti). 

Entonces,  +  hf(ti,Ui).  Esto  muestra  que  la  siguiente  aproximación  m+ 1  se  obtiene  en  el  punto 

donde  la  tangente  a  la  gráfica  de  y(t )  en  t  =  ti  interseca  con  la  recta  vertical  t  =  í¿+i. 

Se  define  el  error  (de  truncamiento)  local  como  el  error  que  se  comete  en  un  paso  cuando  se  supone  que 
todos  los  resultados  previos  son  exactos.  El  error  verdadero,  o  acumulado,  del  método  se  denomina  error  (de 
truncamiento)  global  o  total. 
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y  y  = 


/O) 


error 


hf(U,Ui) 


x 


Figura  6.1:  Interpretación  geométrica  del  método  de  Euler. 


Suponiendo  que  exista  la  derivada  segunda  de  y  y  que  es  continua,  obtenemos  por  el  Teorema  de  Taylor 
(véase  el  error  en  la  derivación  numérica)  que 

h 2 

y(ti+ 1)  -  (y(ti)  +  hf(ti,y(ti )))  =  Y y"(£i),  para  un  &  G  (í¿,í¿+ 1)  adecuado, 

siendo  el  error  local  en  cada  paso  proporcional  a  ú2,  así  que  es  de  orden  0(h2).  Sin  embargo,  el  error  global 
acumula  estos  errores  locales,  así  que  generalmente  crece  mucho  más  rápidamente.  Damos  a  continuación  una 

cota  del  error  global  para  el  método  de  Euler: 


Sea  y{t)  la  única  solución  del  problema  de  Cauchy  ( 6. 1 1  y  sean  uq,ui,  . . .  ,un  las  aproximaciones 
generadas  por  el  método  de  Euler  para  algún  número  natural  N.  Supongamos  que  /  es  continua 
para  todo  t  G  [a,  b }  y  todo  y  G  (— oo,  +oo),  y  que  existen  constantes  L  y  M  tales  que 


df 

dy 


<L, 


Entonces,  para  cada  i  =  0, 1, . . . ,  N,  se  tiene 


I y(U)  ~ui\  <  ^  (ei(tl  a)-l)  ■ 


Comentarios  adicionales.  >  Un  aspecto  importante  que  debemos  resaltar  es  que,  aunque  el  error 
local  del  método  de  Euler  es  de  orden  0(h2),  su  error  global  es  de  orden  <D(h).  Diremos  entonces  que 
el  método  de  Euler  es  un  método  de  primer  orden. 

>  La  reducción  en  una  potencia  del  error  local  al  error  global  es  típica  de  las  técnicas  numéricas  para 
PVI.  De  todas  formas,  aunque  hay  una  reducción  de  orden  del  error  local  al  global,  la  fórmula  muestra 
que  se  puede  reducir  el  error  disminuyendo  el  paso,  de  manera  que  el  error  tiende  a  cero  con  h. 

Ejemplo.  Aplicamos  el  método  de  Euler  con  N  =  10  para  resolver  el  problema  de  valor  inicial  dado  por: 

y'{t)  =  2t-y{t),  2/(0)  = -1, 

y  obtener  el  valor  de  y  en  t  =  1.  Comparamos  también  los  resultados  obtenidos  con  los  valores  de  la  solución 
exacta  y{t)  =  e-í  +2 1  —  2. 

Como  h  =  =  jp  =  0.1  y  f(t,  y)  =  2t  —  y,  se  sigue  que 

2/(0. 1)  ~  Ul  =  u0  +  hf(t0,  u0)  =  -1  +  (0.1)/(0,  -1)  =  -1  +  0.1  =  -0.9, 

y  el  error  es  |j/(0.1)  —  U\  =  0.00484.  Para  calcular  y(0.2),  repetimos  el  proceso,  pero  empezando  ahora  en  el 
punto  (0.1,  —0.9): 

2/(0. 2)  ~  u2  =  ui  +  hf{t i,ui)  =  —0.9  +  (0.1)/(0.1,  —0.9)  =  -0.9  +  (0.1)(0.2  +  0.9)  =  -0.79; 

el  error  absoluto  es  |//(0.2)  —  u2\  =  0.00973.  Continuando  el  proceso  de  forma  análoga,  obtenemos,  véase  [IB], 
que  el  valor  de  y  en  t  =  1  es  itio  =  0.348678  y  el  error  cometido  0.0192.  Finalizamos  la  aplicación  del  método 
de  Euler  mostrando  las  gráficas  de  las  soluciones  exacta  y  aproximada  del  PVI  anterior  en  la  figura [C2|  □ 
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Figura  6.2:  Soluciones  exacta  y(t)  =  e  *  +  2t  —  2  (línea  continua)  y  aproximada  mediante  el  método  de  Euler 
con  N  =  10  (puntos). 


Puesto  que  se  ha  construido  el  método  de  Euler  a  partir  del  Teorema  de  Taylor,  el  primer  intento  para 
hallar  métodos  que  mejoren  la  precisión  del  método  de  Euler  consistirá  en  extender  esta  técnica  de  construc¬ 
ción.  Así,  véase  [7j,  si  expresamos  la  solución  y(t)  del  problema  de  Cauchy  (6.1 1  en  términos  de  su  n-ésimo 
polinomio  de  Taylor  alrededor  de  se  deriva  sucesivamente  la  solución  y(t)  y  se  sustituyen  estos  resultados 
en  el  desarrollo  de  Taylor  se  obtiene,  eliminando  el  término  de  error,  la  correspondiente  ecuación  en  diferencias 
del  método  de  Taylor  orden  n : 


u0  =  y0,  ui+i  =  Ui  +  hT$n\  i  =  0, 1, . . . ,  N  -  1,  (6.2) 

donde 

h  h n~1 

Ti"  =  T{n\ti,Ui)  =  f{ti,Ui )  +  -f'(ti,Ui)  H - h 

El  error  local  es  ^¡^i/n+1)(£¿)>  Para  algún  £  (íi,t»+i). 

Las  estimaciones  del  error  global  para  los  métodos  de  Taylor  son  parecidas  a  las  del  método  de  Euler. 
Si  se  dan  suficientes  condiciones  de  derivabilidad,  entonces  el  método  de  Taylor  de  orden  n  tendrá  un  error 
local  de  0(hn+1)  y  un  error  global  de  orden  0{hn). 

Nota.  La  fórmula  de  se  expresa  fácilmente,  pero  es  difícil  de  usar  porque  requiere  conocer  las  derivadas 
de  f(t ,  y(t))  con  respecto  a  t.  Como  /  es  una  función  de  las  dos  variables  t  e  y,  la  regla  de  la  cadena  dice  que 
la  derivada  total  de  /  con  respecto  a  t,  que  hemos  denotado  por  f(t,y(t )),  está  dada  por 

■  jt  +  ^(t,y(t))  =  ^£(t,y(t))  +  ®^{t,y{t))  y'{t), 


o  bien,  puesto  que  y'(t)  =  f(t,y(t )),  por 

r)  f  r)  f 

f(t,  y(t ))  =  -^(t,  y{t ))  +  f{t,  y(t ))  -^(t,  y(t))  =  ft(t,  y(t))  +  f{t,  y{t))fv{t,  y(t)). 

Las  derivadas  de  órdenes  superiores  se  obtienen  de  forma  parecida,  pero  se  van  haciendo  cada  vez  más 
complicadas.  Por  ejemplo,  f'{t,y(t))  involucra  todas  las  derivadas  parciales,  tanto  con  respecto  a  t  como  a 
y ,  de  todos  los  términos  del  miembro  derecho  de  la  última  igualdad. 


6.4.  Métodos  de  Runge-Kutta 


Acabamos  de  ver  cómo  se  pueden  generar  métodos  de  Taylor  de  orden  superior.  Sin  embargo,  la  aplicación 
de  estos  métodos  de  orden  superior  a  problemas  concretos  se  complica  por  la  necesidad  de  calcular  y  evaluar 


las  derivadas  de  orden  superior  con  respecto  a  t  del  segundo  miembro  de  la  EDO  (6.1 1. 


Los  métodos  anteriores  son  ejemplos  elementales  de  métodos  de  un  paso.  Esquemas  más  sofisticados,  que 
permiten  alcanzar  un  orden  de  precisión  superior,  son  los  métodos  de  Runge-Kutta  y  los  métodos  multipaso. 
En  esta  sección  consideraremos  los  métodos  de  Runge-Kutta  (abreviadamente,  RK),  que  son  métodos  de 
un  paso;  sin  embargo,  requieren  de  varias  evaluaciones  de  la  función  f(t,  y)  sobre  cada  intervalo  [t¿,  ij+i].  Estos 
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métodos  resultan  de  modificar  los  métodos  de  Taylor  para  que  el  orden  de  las  cotas  del  error  se  conserve,  pero 
eliminando  la  necesidad  de  determinar  y  evaluar  derivadas  parciales  de  orden  alto.  La  estrategia  consiste  en 
aproximar  un  método  de  Taylor  mediante  un  método  que  sea  más  fácil  de  evaluar,  lo  que  podría  incrementar 
el  error,  pero  se  hace  de  manera  que  el  incremento  no  exceda  el  orden  del  error  de  truncamiento  que  ya 
presenta  el  método  de  Taylor.  Como  consecuencia,  los  nuevos  errores  no  influyen  significativamente  en  los 
cálculos  (véase  0). 

En  su  forma  más  general,  un  método  RK  puede  escribirse  de  la  forma 

S 

.  i  —  Ui  T  ^  ~  hjKj ,  i  ^  0, 

3= 1 


donde 

Kj  —  h  f  Cjh7  ni  T  ^  ^  ,  j  —  1,  2  . . . ,  s, 

y  s  indica  el  número  de  evaluaciones  de  /  que  hay  que  efectuar  (número  de  etapas  del  método).  Los  coeficientes 
{ a,  y  fe } ,  {cj}  y  {bj}  caracterizan  totalmente  un  método  RK  y  habitualmente  se  recogen  en  la  llamada  tabla  de 
Butcher 


Ci 

an 

ai2  • 

ais 

C2 

021 

022 

a2s 

Cs 

«si 

0S2  • 

Q-ss 

h 

b2  ■ 

■  bs 

c 

A 

hT 

donde  A  =  (ajk)  £  Rsxs,  b  =  (b1,b2,  ■  ■  ■ ,  bs)T  £  Rs  y  c  =  (ci,  c2, . . . ,  cs)T  £  Ms.  Si  los  coeficientes  a ^  de 
A  son  iguales  a  cero  para  k  >  j,  con  j  =  1,2 , . . . ,  s,  entonces  cada  Kj  puede  calcularse  explícitamente  en 
términos  de  los  j  —  1  coeficientes  Ki,K2,  ...  ,Kj_ i  que  ya  han  sido  determinados.  En  tal  caso  el  método  RK 
es  explícito.  En  caso  contrario  es  implícito,  siendo  necesario  resolver  un  sistema  no  lineal  de  tamaño  s  para 
calcular  los  coeficientes. 

Uno  de  los  métodos  de  Runge-Kutta  más  utilizados  es  el  método  de  Runge-Kutta  de  cuarto  orden 
clásico : 

uo  =  Vo,  =  Ui  +  -(Ki  +  2K2  +  2K3  +  K4),  i  =  0,1, . . . ,  N  —  1, 

6 


0 

Ki  —  h  f(ti,  Ui),  1, 

1 

2 

K2  =  hf(ti  +  Ui  +  \Ki),  1 

0  h 

K3  =  hf(ti  +  \h,Ui  +  \K2),  1 

001 

A4  =  h  f(U  +  h,m  +  K3), 

1111 

6  3  3  6 

Este  método  (que  llamaremos  RK4)  simula  la  precisión  del  método  de  Taylor  de  orden  cuatro  y  puede 
deducirse  emparejando  los  coeficientes  anteriores  con  los  del  método  de  Taylor  de  orden  cuatro  de  manera 
que  el  error  local  sea  de  orden  0(h5).  Es  explícito,  con  un  error  global  de  orden  0(h4)  y  requiere  de  cuatro 
nuevas  evaluaciones  de  /  en  cada  paso. 

El  método  de  Runge-Kutta  de  segundo  orden  (que  llamaremos  RK2)  simula  la  precisión  del  método 
de  Taylor  de  orden  dos.  Aunque  no  es  un  método  tan  bueno  como  el  RK4,  los  razonamientos  que  nos  conducen 
a  su  desarrollo  son  más  fáciles  de  entender  y  sirven  para  ilustrar  las  ideas  que  están  involucradas  en  los  métodos 
de  Runge-Kutta. 
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La  forma  de  la  fórmula  para  el  método  RK2  se  obtiene  reemplazando  la  función  hT¿n'1  en  ( 6.2  (  por  la 
función  aK[  +  bK2-,  es  decir, 

ui+i  =  Ui  +  aKi  +  bK2,  (6.3) 


donde 


Ki  =  h  / (ti,  Ui),  K2  =  h  f  (ti  +  ah,Ui  +  /3Ki), 


y  a,  6,  a  y  ¡3  son  constantes  a  determinar,  de  manera  que  ( 6.3  I  sea  tan  exacta  como  sea  posible. 

Para  determinar  estas  constantes,  hacemos  que  la  ecuación  (6.3)  coincida  con  el  desarrollo  en  serie  de 
Taylor  de  y(t)  en  ti.  Por  una  parte,  como 


y(U+ 1)  =  y(ti )  +  hy’ {ti)  +  \ y" {ti )  H - 

=  y{k )  +  hf{ti ,  y{U))  +  y{U))  +  •  ■ 


y  f{ti,y{ti ))  =  ft{ti,y{ti))  +  f{tuy{ti))fy{U,y{ti)),  se  sigue  que 

K2 

y{ti+ 1)  =  y{U)  +  hf{ti,  y{U ))  +  —  ( ft{ti ,  y{ti))  +  f{ti ,  y{ti))fy{ti,  y{U)))  +  C>(/i3).  (6.4) 

Por  otra  parte,  si  ahora  desarrollamos  /(t¿  +  a/i,  +  (3K\ )  en  serie  de  Taylor  de  orden  dos  para  una  función 
de  dos  variables,  se  obtiene 


f{U  +  ah,Ui  +  /3A'i)  =  f{ti,Ui)  +  ahft{ti,Ui )  +  PKify{ti,Ui)  +  C>(/i2), 


de  manera  que  al  sustituir  la  última  expresión  en  (|6.3|),  queda 


ui+ 1  =  Ui  +  ahf{ti,Ui)  +  bhf{tz  +  ah,m  +  (3Ki) 


=  Ui  +  ahf{ti,Ui )  +  bh{f{U,Ui)  +  ahft{ti,Ui )  +  /3AÚ/y(ó,  u¿))  +  0(/i3) 

=  Ui  +  (a  +  b)hf{ti,Ui)  +  bh 2  (a/t(í¿,u¿)  +  (3f{U,Ui)fy{ti,Ui))  +  0{h3) 


Finalmente,  si  comparamos  (6.4)  y  la  expresión  anterior,  obtenemos  el  sistema 


a  +  b  =  1, 


a  =  /? 


1 

26’ 


que  es  un  sistema  de  tres  ecuaciones  con  cuatro  incógnitas,  pudiéndose  elegir  entonces  una  variable  arbitra¬ 
riamente. 

Existen  por  tanto  una  infinidad  de  fórmulas  de  Runge-Kutta  de  segundo  orden,  que  simulan  la  precisión 
del  método  de  Taylor  de  orden  dos,  de  manera  que  tendrán  un  error  local  de  0{h3)  y  un  error  global  de  0{h 2). 
Por  lo  tanto,  cada  fórmula  da  los  mismos  resultados  exactos  si  la  EDO  es  cuadrática,  lineal  o  constante.  A 
continuación,  damos  las  tres  fórmulas  más  conocidas. 

Si  a  =  0,  b  =  1  y  a  =  (3  =  el  método  RK2  que  obtenemos  se  conoce  como  método  del  punto  medio: 


«o  =  ?/o,  ui+i  =  Ui  +  K2,  i  =  0,1, . . . ,  N  -  1, 


donde 


.Ai  h  f  {ti ,  Ui) , 

K2  =  h  f  {U  +  \h,Ui  +  \Kx), 


0 

1 

1 

2 

2 

0  1 

Sia  =  6=  1  y  a  =  d  =  1,  el  método  RK2  que  obtenemos  se  conoce  como  método  de  Euler  modificado 
(o  método  del  trapecio): 


«o  =  2/o,  «j+i  =  Ui  +  -{Ki  +  K2),  i  =  0,1, . .., N  -  1, 
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donde 


I<i  =  h  f  {ti,  Ui), 


0 

1  1 


K2  —  h  f(ti  +  h,Ui  +  Ki ), 


Sia  =  \,  b  =  |  y  a  =  (3  =  el  correspondiente  método  RK2  se  conoce  como  método  de  Ralston  (o 


método  óptimo): 


uo  =  y  o, 


Ui+ 1  =  Ui  + 


donde 


0 


K\  =  hf(U,  Ui), 

K2  =  h  f  (ti  +  |  h,Ui  +  |Ai), 


que  corresponde  al  método  RK  de  segundo  orden  que  tiene  un  mínimo  en  el  error  de  truncamiento  (|Hj)- 


Ejemplo.  Utilizamos  ahora  el  método  del  punto  medio  con  N  =  10  para  obtener  una  aproximación  a  la 
solución  del  problema  de  valor  inicial  anterior 


y'(t)  =  2t-y(t),  y(0)  =  -1, 


en  t  =  1. 

Con  h  =  jó  =  0.1  y  f(t,  y)  =  2t  —  y,  el  primer  paso  del  método  del  punto  medio  para  aproximar  z/(0. 1)  es: 
Ki  =  hf(tQ,u0)  =  (0.1)/ (0,  — 1)  =  0.1, 

K2  =  hf(t0  +  \h,u  o  +  \KX)  =  (0.1)/(0  +  §(0.1), -1  +  §(0.1))  =  0.105, 


iti  =  uq  +  K2  =  — 1  +  0.105  =  —0.895. 

Continuando  con  las  aproximaciones  numéricas,  se  obtiene  que  en  t  =  1,  el  valor  dado  por  el  método  del  punto 
medio  es  z¿i0  =  0.368541  y  el  error  absoluto  es  |y (1)  —  wi0|  =  0.000662,  como  puede  verse  en  [IB].  Finalizamos 
la  aplicación  del  método  del  punto  medio  mostrando  las  gráficas  de  las  soluciones  exacta  y  aproximada  del 
P VI  anterior  en  la  figura |6.3|  □ 


Figura  6.3:  Soluciones  exacta  y(t)  =  e  t  +  2í  —  2  (línea  continua)  y  aproximada  mediante  el  método  del  punto 
medio  con  N  =  10  (puntos). 

Comentario  adicional.  >  Una  forma  de  comparar  los  métodos  de  Runge-Kutta  de  orden  bajo  es  la 
siguiente.  El  método  RK4  requiere  cuatro  evaluaciones  de  /  por  paso,  de  manera  que  para  que  fuese 
superior  al  método  de  Euler,  que  requiere  solo  una  evaluación  de  /  por  paso,  debería  dar  respuestas 
más  precisas  que  el  método  de  Euler  con  tamaño  de  paso  igual  a  la  cuarta  parte  del  tamaño  de  paso  del 
método  RK4.  Análogamente,  para  que  el  método  RK4  fuese  superior  a  los  métodos  de  Runge-Kutta  de 
segundo  orden,  que  requieren  dos  evaluaciones  por  paso,  debería  ser  más  preciso  con  tamaño  de  paso 
h  que  un  método  de  segundo  orden  con  tamaño  de  paso  |.  Véase  el  ejemplo  de  la  pág.  209  de  [7¡  en  el 
que  se  ilustra  la  superioridad  del  método  RK4  con  respecto  a  esta  medida. 
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6.5.  Métodos  multipaso 


Los  métodos  de  Taylor  y  de  Runge-Kutta  son  ejemplos  de  métodos  de  un  paso  para  aproximar  soluciones  de 
PVI.  Estos  métodos  solo  emplean  para  calcular  la  aproximación  de  y(í¿+ 1),  sin  utilizar  explícitamente 
las  aproximaciones  previas  uq,ui,  . . . ,  u,;_i .  Generalmente  requieren  de  algunas  evaluaciones  de  la  función  / 
en  puntos  intermedios,  pero  éstas  se  descartan  tan  pronto  como  se  obtiene  Uj+i. 

Como  la  exactitud  de  | y(tj)  —  Uj\  disminuye  conforme  aumenta  j,  podemos  construir  mejores  métodos 
de  aproximación  si,  al  aproximar  y(í¿+i),  incluimos  en  el  método  algunas  aproximaciones  previas  Los 
métodos  que  desarrollan  esta  idea  se  llaman  métodos  de  varios  pasos  o  métodos  multipaso.  Es  decir, 
los  métodos  de  un  paso  solo  tienen  en  cuenta  lo  que  ocurrió  en  el  paso  anterior,  mientras  que  los  métodos 
multipaso  tienen  en  cuenta  lo  ocurrido  en  varios  pasos  anteriores.  El  principio  que  los  guía  se  describe  a 


continuación.  Deseamos  resolver  el  PVI  (6.1).  Integrando  la  EDO  de  (6.1 1  entre  y  t¿+i,  obtenemos: 


y{ti+i)  -  y{ti)  =  f  y'(t)dt=  í  f(t,y{t))dt  =>  yiU+i)  =  y(ti)  +  f  f(t,y{t))dt. 

Jtñ  Jti  Jti 


Puesto  que  no  podemos  integrar  f(t ,  y(t))  sin  conocer  y(t),  que  es  la  solución  del  problema,  integramos  en  su 
lugar  el  polinomio  de  interpolación  p(t)  que  aproxima  f(t,  y(t)).  Suponiendo  además  que  y(U)  —  Ui ,  tenemos: 


y{ti+ 1)  ^  u.¿  + 


(6.5) 


Si  Um+i  es  la  primera  aproximación  que  se  va  a  generar  usando  un  método  multipaso,  entonces  necesitamos 
conocer  los  valores  de  partida  Uo,Ui, . . .  ,um  del  método.  Estos  valores  de  partida  se  generan  usando  un 
método  de  Runge-Kutta  o  alguna  otra  técnica  de  un  paso  que  tenga  el  mismo  orden  de  error  que  el  método 
multipaso. 

Hay  dos  clases  distintas  de  métodos  multipaso:  explícitos  e  implícitos.  En  un  método  explícito,  el  cálculo 
de  u¿_|_ i  no  supone  la  evaluación  de  la  función  /(t¿_|_i,  Uí+i),  mientras  que  en  un  método  implícito  si. 

La  precisión  de  una  solución  numérica  de  un  PVI  está  en  gran  medida  determinada  por  el  orden  del 
método  utilizado.  El  orden  indica  cuantos  términos  de  una  solución  expresada  en  serie  de  Taylor  se  están 
simulando  mediante  este  método. 


6.5.1.  Métodos  explícitos  de  Adams-Bashforth 


Supongamos  que  la  fórmula  resultante  de  (6.5 1  es  del  tipo 


Ui  +  1  =Ui  +  Ci  f(ti,  Ui)  +  C2f{ti- 1,  Ui-i)  +  C3f(ti- 2,  Ui-2 )  -I - 


(6.6) 


donde  ci,  C2,  c3, . . .  son  constantes.  Una  expresión  de  este  tipo  se  conoce  como  fórmula  de  Adams-Bashforth 
(abreviadamente,  AB).  A  partir  del  polinomio  de  interpolación  de  grado  m  —  1,  se  obtiene  una  fórmula  AB 
de  m  pasos. 

En  las  fórmulas  de  Adams-Bashforth,  suponemos  que  p{t)  está  dado  por  el  polinomio  de  interpolación  en 
los  m  puntos: 

ifi  >  fifi >  Ui))  ,  (¿i  —  1 ,  f  {ti—  1 ,  Ui—  i )  ),  .  .  .  ,  (¿i— m- (-1 ,  f  (ti-m+:l :  Ui-m-y.  i )  )  . 

Si  m  =  1,  la  correspondiente  fórmula  AB  se  reduce  al  método  de  Euler.  Damos  a  continuación  algunas  otras 
fórmulas,  junto  con  los  valores  de  partida  que  se  requieren  y  sus  términos  de  error  local. 


Método  explícito  de  Adams-Bashforth  de  dos  pasos  (AB2)  (m  =  2): 

uo  =  yo ,  ux  =  2/1,  u»+i  =  Ui  +  ^  (3f(ti,Ui)  -  /(íi_i,Wi_i)) , 
para  i  =  1, 2, . . . ,  N  —  1,  con  error  local  j^y'" (£i)h3 ,  para  algún  G  (i¿_i,t¿+i). 

Método  explícito  de  Adams-Bashforth  de  tres  pasos  (AB3)  (m  =  3): 

UQ  =  yo,  ui  =  2/i)  «2  =  2/2,  «i+1  =  «*  +  ^  (23/(ít,w¿)  -  16/(t»-i,u»-i) +  5/(ii_2,ui_2)) , 
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para  i  =  2, 3, . . . ,  N  —  1,  con  error  local  § y^lv\^i)h4,  para  algún  1). 

Método  explícito  de  Adams-Bashforth  de  cuatro  pasos  (AB4)  (m  =  4): 


«0=2/0,  Mi  =2/1,  «2  =  2/2,  «3=2/3, 

«j+1  =  ^  (55/(¿D  «»)  -  59/(í¿_i,«¿_1)  +  37/(í¿_2,  «¿-2)  -  9/(í¿_3,  «i_3)) , 

para  *  =  3, 4, . . . ,  A  —  1,  con  error  local  ff Para  algún  £  (t¿_3,  í¿+i). 

Ejemplo.  Aplicamos  a  continuación  el  método  AB4  con  A  =  10  para  obtener  una  aproximación  del  problema 
de  valor  inicial  anterior 

y\t)  =  2t-y(t),  2/(0)  =  — 1, 

en  t  =  1. 

Podemos  obtener  los  valores  iniciales  mediante  el  método  RK4,  pero  como  conocemos  la  solución  exacta, 
y(t)  =  e_t  +2 1  —  2,  la  utilizamos  para  obtener  los  valores  iniciales: 

u0  =  -1,  mi  =  2/(0. 1)  =  -0.895162,  u2  =  y{ 0.2)  =  -0.781269,  u3  =  y(0.3)  =  -0.659181. 

Ahora, 

«4  =  «3  +  5j(55/(í3,m3)  -  59/(í2,«2)  +  37/(¿i,mi)  -  9/(í0,«o)) 

=  -0.659181  +  (55/(0. 3,  -0.659181)  -  59/(0. 2,  -0.781269) 

+37/(0. 1,  -0.895162)  -  9/(0,  -1)) 

=  -0.659181  +  D  (55(1.259181)  -  59(1.181269)  +  37(1.095162)  -  9(1)) 

=  -0.529677 

y,  continuando  de  forma  análoga,  véase  H5I.  se  tiene:  Mío  =  0.369344  y  el  error  cometido  es  |y(l)  —  Mio|  = 
0.00146.  □ 

Comentario  adicional.  >  La  principal  desventaja  común  de  todos  los  métodos  multipaso,  en  general, 
y  de  los  métodos  AB,  en  particular,  es  que  se  necesitan  conocer  los  valores  de  partida.  Por  ejemplo,  para 
el  método  AB4,  se  necesitan  cuatro  valores  de  partida  antes  de  que  el  método  se  pueda  utilizar.  En  la 
práctica,  como  se  ha  dicho  anteriormente,  se  utiliza  un  método  de  un  paso  con  el  mismo  orden  de  error 
para  determinar  los  valores  de  partida.  El  método  AB4  se  utiliza  frecuentemente  con  el  método  RK4 
porque  ambos  tienen  un  error  local  de  orden  0(h5).  La  ventaja  de  los  métodos  AB  sobre  los  métodos 
de  un  paso  es  que  el  cálculo  de  u¿+i  requiere  solo  una  evaluación  de  f(t,y)  por  paso,  mientras  que 
los  métodos  RK  de  órdenes  >  3  requieren  cuatro  o  más  evaluaciones  de  la  función.  Por  esta  razón,  los 
métodos  multipaso  pueden  ser  el  doble  de  rápidos  que  los  métodos  RK  de  exactitud  comparable. 


6.5.2.  Métodos  implícitos  de  Adams-Moulton 


Raramente  se  utilizan  las  fórmulas  AB  de  manera  aislada,  habitualmente  se  suelen  utilizar  junto  con  otras 
fórmulas  para  aumentar  la  precisión  de  la  aproximación  numérica.  Con  el  fin  de  observar  cómo  es  posible 
esto,  volvemos  a  la  aproximación  (6.5 1  y  supongamos  que  se  emplea  una  fórmula  de  cuadratura  numérica  que 

da  como  resultado: 


comprende  a  /(i¿+i,  w¿+i).  Supongamos  ahora  que  (|6.5|) 

«i+l  =  «¿  +  Ci/(i»+i,  Ui+i)  +  C2f(ti,  Ui )  +  C3/(íi_i,  Ui-i)  + 


donde  ci,C2,c3, . . .  son  constantes.  La  situación  más  sencilla  es  la  que  considera  el  polinomio  p(t)  como  el 
polinomio  de  interpolación  en  los  m  +  1  puntos: 


(t¿+ 1,  /  (ti+l«¿+l)),  (íi,/(í¿,ti¿)),...,  (ti—m+ 1,  /  (ti  — m+1 ,  «i— m+1 ))  • 

Se  relacionan  a  continuación  los  ejemplos  más  comunes  de  expresiones  de  este  tipo,  que  se  conocen  como 
fórmulas  de  Adams-Moulton  (abreviadamente,  AM).  Obsérvese  que  el  error  local  de  un  método  implícito  de 
(m  —  1)  pasos  es  de  orden  0(hm+1),  lo  mismo  que  el  de  un  método  explícito  de  m  pasos.  Sin  embargo,  ambos 
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usan  m  evaluaciones  de  la  función,  ya  que  los  métodos  implícitos  incluyen  /(£¿+i, pero  los  explícitos 
no. 


Método  implícito  de  Adams-Moulton  de  dos  pasos  (AM3)  (m  =  2): 

«o  =  2/0,  Mi  =2/i,  «¿+i  =  Ui  +  ^  (5f(ti+1,ui+1)  +  , 

para  *  =  1, 2, . . . , TV  —  1,  con  error  local  ^y^  (Íi)h4 ,  para  algún  C  (í¿_i,i¿+i). 

Método  implícito  de  Adams-Moulton  de  tres  pasos  (AM4)  ( m  =  3): 

«0  =  2/0,  «1=2/1,  «2=2/2, 

«¿+1  =  ^  (9/(ti+i,  «i+l)  +  19 f  (ti,  Ui)  -  5/(íj_i,  «¿_l)  +  /(t¿_ 2,  «*-2)) , 

para  i  =  2, 3, . . . ,  A  —  1,  con  error  local  Para  algún  £  (í¿_ 2,  t¿+i). 

Comentario  ADICIONAL.  >  Resulta  de  interés  comparar  el  método  explícito  AB  de  m  pasos  con  el 
método  implícito  AM  de  m  —  1  pasos.  Ambos  requieren  m  evaluaciones  de  /  por  paso  y  ambos  tienen 
los  factores  i/(m+1)(£i)/im+1  en  sus  términos  de  error  local.  Además,  en  general,  los  coeficientes  de  las 
evaluaciones  de  /  en  la  fórmula  de  aproximación  y  en  el  término  de  error  local  son  menores  en  el  método 
implícito  que  en  el  explícito  del  mismo  orden,  lo  que  conlleva  menores  errores  de  truncamiento  y  de 
redondeo  en  los  métodos  implícitos.  Por  el  contrario,  obsérvese  que  los  métodos  implícitos  tienen  la 
necesidad  de  reformular  algebraicamente  la  ecuación  en  diferencias  para  obtener  una  representación 
explícita  de  u¿+i,  lo  que  puede  ser  difícil,  sino  imposible. 

6.5.3.  Métodos  predictor-corrector 

Para  sacar  provecho  de  las  propiedades  beneficiosas  de  los  métodos  implícitos  y  evitar  las  dificultades 
en  la  resolución  de  la  ecuación  implícita,  estos  métodos  implícitos  no  se  suelen  utilizar  en  la  práctica  en 
solitario,  sino  que  se  suelen  utilizar  para  mejorar  las  aproximaciones  obtenidas  por  los  métodos  explícitos. 
La  combinación  de  un  método  explícito  con  uno  implícito  recibe  el  nombre  de  método  de  predicción  y 
corrección  o  método  predictor-corrector.  El  método  explícito  predice  una  aproximación  y  el  método 
implícito  la  corrige.  Gozan  del  orden  de  precisión  del  método  corrector. 

El  método  predictor  es  una  fórmula  explícita  y  se  utiliza  en  primer  lugar  para  determinar  una  estimación 
Ui+ 1  de  la  solución,  que  se  calcula  a  partir  de  la  solución  conocida  en  el  punto  anterior  mediante  un  método 
de  un  paso  o  a  partir  de  la  solución  conocida  en  varios  puntos  anteriores  mediante  un  método  multipaso. 
Una  vez  calculada  la  estimación  ui+1,  se  aplica  el  método  corrector,  que  utiliza  el  valor  estimado  mí+1  en  la 
parte  derecha  de  la  ecuación  de  un  método  implícito,  para  calcular  una  nueva  estimación  de  la  solución,  más 
exacta  que  1,  en  la  parte  izquierda  de  la  ecuación  del  método.  Por  lo  tanto,  el  método  corrector  que  suele 
ser  un  método  implícito  se  utiliza  de  manera  explícita,  ya  que  no  se  requiere  resolver  una  ecuación  no  lineal. 
(Además,  podemos  repetir  la  aplicación  del  método  corrector  varias  veces,  de  manera  que  el  nuevo  valor  de 
Uí+i  se  sustituye  de  nuevo  en  la  parte  derecha  de  la  ecuación  del  método  corrector  para  obtener  una  nueva 
aproximación  de  iq+i  más  refinada,  véase  uno 

Un  método  predictor-corrector  popular,  llamado  ABM4,  utiliza  la  fórmula  AB4  como  método  predictor 
y  la  fórmula  AM4  como  método  corrector.  El  primer  paso  es  calcular  los  valores  de  partida  u o,  u±,  U2  y  «3 
para  el  método  explícito  AB4.  Para  calcular  estos  cuatro  valores,  utilizamos  un  método  de  un  paso  de  cuarto 
orden,  especificamente,  el  método  RK4.  El  siguiente  paso  es  calcular  una  aproximación  u 4  de  2/(^4)  mediante 
el  método  explícito  AB4  para  hacer  la  predicción  (véase  0): 

«4P  =  «3+¿  (55/(í3,  u3)  -  59/(í2,  «2)  +  37/(ti,«i)  -  9/(í0,  «0))  ■ 

Esta  aproximación  se  mejora  utilizando  ahora  el  método  implícito  AM4  como  corrector: 

«4  =  «3  +  ^  (9/(Í4,  «4  )  +  !9/(Í3,  «3)  ^  5/(í2,  «2)  +  f(h,  «1))  • 

El  valor  U4  es  el  que  se  usa  como  aproximación  de  2/(^4)-  Ahora  la  técnica  de  utilizar  el  método  AB4  para  hacer 
la  predicción  y  el  de  AM4  para  hacer  la  corrección  se  repite,  hallándose  y  u$,  las  aproximaciones  inicial 
y  final  respectivas  de  y(t§).  El  proceso  se  reitera  hasta  que  obtengamos  la  aproximación  de  y(tw )  =  y(b)- 
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6.6.  Ecuaciones  de  orden  superior  y  sistemas  de  ecuaciones  dife¬ 
renciales 

Los  métodos  desarrollados  en  las  secciones  previas  se  pueden  extender  ahora  fácilmente  para  resolver  PVI 
de  orden  superior.  Consideramos  el  caso  general  de  una  EDO  de  orden  q  >  2 


y{q\t)  =  f(t,y(t),y'(t),...,yiq  1}(í)),  para  todo  t  €  [a,  b], 
sujeta  a  las  condiciones  iniciales 

y  (a)  =  yo,  y'(a )  =  y\,  ■■■,  y{q~1]{a)  =  yq- 1- 


(6.7) 


La  ecuación  ( 6.7  (  se  puede  transformar  en  un  sistema  de  primer  orden  de  m  ecuaciones  diferenciales.  Para 

wi (t)  =  y(t),  w2{t)  =  y'{t),  wq(t)  =  í/(9_1)(í), 


ello,  ponemos 


de  manera  que  la  ecuación  (6.7)  puede  ahora  escribirse  como 


=  w2, 

w'2 

=  U>3, 

W'q- 1 

=  Wq, 

W'q 

=  f(t,W!,W2,. 

-,Wq) 

con  condiciones  iniciales 


wi(a)  =  y0,  w2{a)  =  ylt  iug_i(a)  =  yq-\. 


Para  resolver  el  sistema  anterior  se  puede  aplicar  a  cada  ecuación  individual  uno  de  los  métodos  desarrollados 
en  las  secciones  previas. 

Ejemplo.  Consideramos  el  método  de  Euler  aplicado  a  las  siguientes  dos  ecuaciones  simultáneas 

(  Vi  =  fi(t,yi{t),y2(t)), 
l  2/2  =  h(t,yi(t),y2{t)), 

De  la  fórmula  del  método  de  Euler  se  sigue  que  el  paso  z-ésimo  sería 


1 


1 


=  +  hf2{ti,u\,u¡).  □ 


Escribiendo  el  sistema  anterior  en  forma  vectorial  y ’(t)  =  F(í,  y(t)),  con  una  elección  obvia  de  la  notación, 
la  extensión  de  los  métodos  desarrollados  anteriormente  en  el  caso  de  una  sola  ecuación  al  caso  vectorial  es 
directa.  Así,  el  método 

u0  =  y0,  u»+i  =  ut  +  hF(ti,  u¿),  i  >  0, 
es  la  forma  vectorial  del  método  de  Euler. 


6.7.  Sugerencias  para  seguir  leyendo 

Para  un  tratamiento  más  profundo  de  los  métodos  numéricos  para  EDO  se  recomiendan  los  siguientes 
textos:  m  y  Ralston  y  Rabinowitz  (2001).  Otros  textos  que  ofrecen  un  estudio  exhaustivo  son:  Butcher 
(2008),  Gear  (1971)  y  Golub  y  Ortega  (1992).  Un  texto  interesante  que  analiza  los  sistemas  de  ecuaciones 
diferenciales  es  Lambert  (1991),  donde  se  explica  que  las  condiciones  para  los  órdenes  de  los  métodos  escalares 
y  vectoriales  (sistemas),  aunque  tengan  la  «misma  forma»,  varían  entre  unos  y  otros,  obteniéndose  distintos 
órdenes. 
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6.8.  Ejercicios 

1.  Apliqúese  el  método  de  Euler  explícito  con  paso  h  =  0.1  para  aproximar  el  valor  y(  1)  de  la  solución  de 
la  ecuación  integral 


y(t)  = 


eos (s  +  y(s))  ds 


transformándola  previamente  en  un  PVI. 

2.  Encuéntrese  la  solución  exacta  del  PVI 

y'(t)  =t2  +  y(t),  te  [0,1],  2/(0)  =  1. 

Hállese  una  aproximación  numérica  obtenida  mediante  el  método  de  Euler  con  paso  de  integración 
h  =  0.2. 

i 2 

3.  La  función  y(t)  =  —  es  la  solución  del  PVI 

y\t)  =  y/y(£j,  2/(0)  =  0. 

Calcúlese  mediante  el  método  de  Euler  una  aproximación  de  la  solución.  ¿Qué  es  lo  que  sucede?  Dese 
una  explicación. 

4.  Obtención  del  método  de  Euler  utilizando  integración  numérica.  Véase  la  equivalencia  entre  aplicar  el 
método  de  Euler  a  la  resolución  del  problema  de  Cauchy  (6.1)  y  aplicar  la  regla  de  cuadratura  del 
rectángulo  a  la  reformulación  del  problema  de  Cauchy  en  forma  integral. 

5.  Obténgase  el  valor  exacto  de  2/(0. 1)  a  partir  de  la  solución  exacta  del  PVI 

y'{t)  =  -ty{t)2,  //(O)  =  2. 

A  continuación,  aproxímese  numéricamente  el  valor  de  ?/(0.1)  mediante  el  método  de  Taylor  de  segundo 
orden.  Compárense  los  resultados. 

6.  Construyase  un  método  RK  explícito  de  segundo  orden  y  dos  etapas  tal  que  b\  =  \  y  dese  su  tabla 
de  Butcher.  Resuélvase  el  PVI  del  ejercicio  2  mediante  este  método  con  el  mismo  paso  de  integración. 
Compárense  los  resultados. 


7.  Si  f(t,y(t))  depende  solo  de  t  (es  decir,  f(t,y(t))  =  f(t))  en  el  problema  de  Cauchy  (6.1),  demuéstrese 
que  el  método  RK2  de  Euler  modificado  se  reduce  a  la  regla  de  cuadratura  del  trapecio  y  que  el  método 
RK4  se  reduce  a  la  regla  de  cuadratura  de  Cavalieri-Simpson. 

8.  Dado  el  método 

u0  =  yo,  Ui+ 1  =  Ui  +  hf(ti  +  h1ui  +  hf(ti,  Ui )), 

dígase  si  es  de  tipo  RK  y,  en  su  caso,  escríbase  la  tabla  de  Butcher.  ¿Cuál  es  el  orden  del  método? 

9.  Sea  el  método 

4  K2  +  I<3), 


u0  —  2/0;  Ui+ 1 

K  i 
K2 

k3 


Ui  +  y  (A  1 
6 


hf(ti,Ui), 

hf{ti  +  |  ,Ui  +  \K\), 

hf(U  +  h,Ui  +  2K2  -  K\). 


¿Es  un  método  RK?  En  caso  afirmativo,  dese  su  tabla  de  Butcher.  ¿Cuál  es  el  orden  del  método? 

10.  Obténgase  la  fórmula  recursiva  del  método  RK4.  Para  ello,  téngase  en  cuenta  que  el  método  RK4 
consiste  en  calcular  la  aproximación  ut+i  de  la  siguiente  forma: 


u  o  =  ?/o,  Ui+ 1  =  Ui  +  b\K\  +  b2K2  +  b3K3  +  64A"4, 
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donde 


K\  =  hf(ti,Ui), 


K3  =  hf  (ti  +  c3h ,  Ui  +  a31Ki  +  a32K2), 


K2  —  hf(ti  +  c2h,Ui  +  a2\I\  i) ,  K4  —  /i/(f¿  +  C4/1,  it¿  +  041^1  +  a^2K2  +  CI43ÍY3). 

Compruébese  que  el  método  es  de  cuarto  orden. 


11.  SeaelPVI 


y'(t)  =  t2  +  y{t),  y(0)  =  1. 


Aproxímese  el  valor  y(  1)  utilizando  el  método  AB2  y  tomando  como  método  de  inicio  el  método  RK2 
dado  por 

u0  =  Vo,  ui+ 1  =  Ui  +  hf  (ti  +  m  +  ^ f(ti , 
con  paso  de  integración  h  =  0.2. 

12.  a)  Construyanse  los  métodos  AB2  y  AM2. 
b)  Construyanse  los  métodos  AB3  y  AM3. 

13.  Obsérvese  el  método  de  Euler  explícito  y  construyase  de  manera  análoga  el  método  de  Euler  implícito, 
dado  por 

no  —  Uo ,  n¿- j-i  —  A  hf  (tío- 1 ,  iiz+i )  • 

Utilícense  después  los  dos  métodos  de  Euler  en  la  forma  predictor-corrector  para  resolver  el  PVI 

y'{t)  =  ln  (l  +  t2  +  y(t)2)  +2 1  +  y(t),  y(0)  =  1. 

Escríbanse  las  ecuaciones  del  método  numérico  y  calcúlense  ?/(0.5)  e  ¡/(l)  tomando  h  =  0.5. 

14.  Transfórmese  el  siguiente  PVI  de  segundo  orden 

y"  +  2//  +  y3  =  sen  í,  2/(0)  =  1,  2/'(0)  =  0. 

en  un  sistema  de  ecuaciones  diferenciales  de  primer  orden.  Calcúlense  las  dos  primeras  iteraciones  del 
método  de  Euler  con  paso  de  integración  h  =  0.1. 

15.  Resuélvase,  mediante  el  método  de  Euler,  el  siguiente  sistema  de  ecuaciones  diferenciales 

í  x'{t)  =  x  +  ty(t)  +  1, 

1  y\t)  =  +ty(t )  +í3, 


en  el  intervalo  [0, 1],  con  las  condiciones  iniciales  ®(0)  =  1,  2/(0)  =  1  y  usando  como  paso  de  integración 
A  =  0.2. 

16.  Desarróllese  la  fórmula  del  método  RK2  de  Euler  modificado  para  la  resolución  de  un  sistema  de  dos 
EDO  de  primer  orden.  Dése  también  la  formulación  vectorial  del  método. 


Capítulo  7 

Resolución  numérica  de  problemas  de 
valores  en  la  frontera  en  dos  puntos 

7.1.  Introducción 

Las  EDO  tratadas  en  el  capítulo  anterior  son  de  primer  orden  y  deben  cumplir  una  condición  inicial. 
También  vimos  que  las  técnicas  numéricas  se  pueden  extender  a  sistemas  de  ecuaciones  y  ecuaciones  de  orden 
superior,  siempre  que  las  condiciones  se  especifiquen  en  el  mismo  punto  en  el  que  se  da  el  valor  inicial.  Por 
esta  razón,  tales  problemas  se  denominan  problemas  de  valor  inicial  (abreviadamente,  PVI).  Sin  embargo,  en 
muchos  problemas,  las  condiciones  se  especifican  en  más  de  un  punto.  Debido  a  que  estas  condiciones  se  suelen 
dar  en  los  puntos  extremos  o  frontera  de  un  intervalo,  se  les  denomina  problemas  de  contorno  o  problemas 
de  valores  en  la  frontera  (abreviadamente,  PVF).  Muchas  aplicaciones  importantes  de  la  ingeniería  son  de 
esta  clase,  como  por  ejemplo  la  deflexión  de  una  viga  y  el  flujo  del  calor,  así  como  también  varios  problemas 
físicos.  Los  PVF  son  generalmente  más  difíciles  de  resolver  que  los  PVI.  Para  EDO  de  primer  orden  solo  se 
especifica  una  condición,  así  que  no  hay  diferencia  entre  PVI  y  PVF. 

Presentamos  en  este  capítulo  dos  procedimientos  generales  que  aproximan  la  solución  de  un  PVF:  los 
métodos  de  disparo  y  los  métodos  de  diferencias  finitas.  Los  primeros  transforman  un  PVF  de  segundo  orden 
(u  orden  superior)  en  un  sistema  de  PVI.  En  los  segundos,  las  derivadas  de  la  EDO  se  aproximan  mediante 
fórmulas  de  diferencias  finitas,  resultando  entonces  sistemas  de  ecuaciones  algebraicas  (lineales  o  no  lineales) 
que  hay  que  resolver.  Ambos  métodos  tienen  sus  ventajas  y  desventajas.  Los  métodos  de  diferencias  finitas 
no  necesitan  resolver  la  EDO  varias  veces  para  ajustar  las  condiciones  de  contorno  prescritas  en  el  punto  final 
del  dominio.  Por  otra  parte,  la  solución  de  EDO  no  lineales  utilizando  métodos  de  diferencias  finitas  resulta 
de  la  necesidad  de  resolver  un  sistema  de  ecuaciones  no  lineales  simultáneas  (generalmente  iterativamente), 
que  puede  ser  tedioso  y  difícil.  Los  métodos  de  disparo  tienen  la  ventaja  de  que  la  solución  de  la  EDO  no 
lineal  es  bastante  sencilla.  La  desventaja  de  estos  métodos  es  que  hay  que  resolver  la  EDO  varias  veces. 


7.2.  El  PVF  de  segundo  orden  en  dos  puntos 

Las  ecuaciones  diferenciales  cuyas  soluciones  aproximaremos  aquí  son  de  segundo  orden,  concretamente 
de  la  forma: 

y" (x)  =  f(x,y(x),y'(x)),  para  x  G  [a,  b\, 
con  las  condiciones  de  contorno  que  debe  cumplir  la  solución 

y(a)  =  a  e  y(b)  =  /3, 

para  ciertas  constantes  a  y  j3.  Estas  condiciones  de  contorno  se  llaman  condiciones  de  contorno  de  Dirichlet. 
Un  problema  como  éste  es  un  ejemplo  típico  de  PVF  de  segundo  orden  en  dos  puntos. 

He  aquí  un  ejemplo  de  un  PVF  en  dos  puntos  que  se  puede  resolver  mediante  funciones  elementales: 

y"{x)  +  y(x)  =  0;  y(0)  =  1,  y(  tt/2)  =  2. 
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En  primer  lugar,  podemos  encontrar  la  solución  general  de  la  EDO,  que  es 

y(x)  =  C\  sen  x  +  C2  eos  x. 


Después,  podemos  determinar  las  constantes  C\  y  C2  para  que  las  condiciones  en  la  frontera  se  satisfagan. 
De  este  modo, 

1  =  2/(0)  =  Ci  sen  0  +  C2  eos  0  =  C2, 


2  =  2/(7r/2)  =  Oí  sen(7r/2)  +  O2  cos(7t/2)  =  Oí, 

y  la  solución  es: 

y(x)  =  2  sen  x  +  eos  x. 

La  técnica  que  acabamos  de  ilustrar  no  es  efectiva  cuando  la  solución  general  de  la  EDO  se  desconoce. 
Nuestro  interés  se  centrará  en  los  métodos  numéricos  que  permiten  acometer  cualquier  PVF  en  dos  puntos. 
Antes  de  abordar  los  métodos  numéricos,  es  conveniente  decir  que  no  podemos  asegurar  que  exista  una 
solución  del  PVF  en  dos  puntos  genérico  anterior  por  la  sencilla  suposición  de  que  /  sea  una  función  «decente». 
En  primer  lugar,  hay  que  comprobar  que  se  cumplen  las  siguientes  condiciones  (0): 


■  la  función  /  y  sus  derivadas  parciales  con  respecto  a  y  e  y'  son  continuas, 


■  la  derivada  parcial  de  /  con  respecto  a,  y  es  positiva, 

■  la  derivada  parcial  de  /  con  respecto  a  y'  está  acotada, 

que  garantizan  que  un  PVF  tiene  solución  única  antes  de  emplear  un  método  numérico;  si  no  se  hace,  puede 
que  obtengamos  resultados  absurdos.  Estas  son  condiciones  razonables  en  los  PVF  que  modelan  problemas 
físicos. 


7.3.  El  método  de  disparo  lineal 

Se  dice  que  un  PVF  es  lineal  cuando  la  función  /  es  de  la  forma 

f{x,  y(x),y'(x))  =  p{x)y\x)  +  q(x)y(x)  +  r(x), 

donde  p(x),  q(x)  y  r(x )  son  funciones  arbitrarias.  Los  problemas  lineales  aparecen  frecuentemente  en  apli¬ 
caciones  y  son  mucho  más  fáciles  de  resolver  que  los  no  lineales.  Esto  se  debe  a  que  sumando  una  solución 
particular  de  la  EDO  lineal  completa,  o  no  homogénea, 

y"{x)  -  p(x)y'(x)  -  q(x)y(x)  =  r(x) 

a  la  solución  general  de  la  EDO  lineal  homogénea 

y"{x)  -  p{x)y\x)  -  q(x)y(x)  =  0, 

obtenemos  todas  las  soluciones  de  la  EDO  lineal  completa.  Las  soluciones  del  problema  lineal  homogéneo  son 
más  fáciles  de  calcular  que  las  del  completo.  Además,  para  probar  que  un  PVF  lineal  tiene  solución  única , 
solo  debemos  comprobar  que  las  funciones  p,  q  y  r  son  continuas  y  que  los  valores  de  q  son  positivos. 


Para  aproximar  la  solución  única  del  PVF  lineal,  consideramos  en  primer  lugar  dos  PVI 

y"{x)  =  p(x)y'(x)  +  q(x)y(x) +  r(x),  x  £  [a,b\;  y  (a)  =  a,  y'(a)=  0,  (7.1) 

y"(x)  =  p{x)y'{x )  +  q(x)y(x),  x  £  [a,  b\;  y  (a)  =  0,  y' (a)  =  1,  (7.2) 

que  tienen  solución  única.  Denotemos  la  solución  del  primer  problema  por  yi(x),  la  solución  del  segundo 

problema  por  j/2(*)  y  supongamos  que  j/2(&)  ^  0.  Entonces,  por  la  teoría  básica  de  las  EDO  lineales,  es  fácil 
comprobar  que  la  función 

y{x)  =  yi(x)  +  ^  2/2(z)  (7.3) 

es  la  solución  única  del  PVF  lineal 

y"(x)=p(x)y'(x)  +  q(x)y{x)  +  r(x),  x£  [a,b\;  y(a)  =  a,  y(b)  =  ¡3.  (7.4) 
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(Los  detalles  de  comprobación  se  dejan  para  el  estudiante.) 

Si  por  otra  parte,  3/2 (¿>)  =  0,  entonces  la  solución  y2(a:)  de  y" (x)  =  p(x)y'(x)  +  q(x)y(x)  satisface  1/2(0)  = 
3/2 (&)  =  0,  lo  que  implica  que  2/2(2;)  =  0.  Por  lo  tanto,  y\{x)  satisface  ambas  condiciones  de  contorno. 

Así,  el  método  de  disparo  lineal  consiste  en  sustituir  el  PVF  (7.4)  por  los  dos  PVI  (7.1 1  y  ( 7.2 1 ,  que 
se  resuelven  mediante  cualquier  método  numérico  de  resolución  de  PVI.  Para  ello,  transformamos  sendos 
problemas  en  sistemas  de  primer  orden.  Para  el  problema  (7.1 1,  el  cambio  U\  =  y7  U2  =  y1  transforma  el  PVI 
(7.1 1  en  el  siguiente  sistema  equivalente 

Íu'^x)  =  U2{x);  ui(a)  =  a, 

u'2{x)  =  q(x)ui(x)  +p(x)ii2(x)  +r(x)]  u2(a)  =  0, 

mientras  que  el  cambio  Vi  =  y,  v 2  =  y 1  transforma  el  PVI  (|7.2|)  en  el  sistema  equivalente 

í  v[ (x)  =  V2{x)-,  Vi(a)  =  0, 

[  v'2(x)  =  q{x)vi(x)  +  p(x)v2{x);  v2(a)  =  1. 


Una  vez  que  se  dispone  de  las  aproximaciones  yi{x)  e  3/2 (íc) ,  la  solución  del  PVF  ( 7.4  (  se  aproxima  usando 
la  expresión  (7.3 1. 


Ejemplo.  Sea  el  PVF 

y"{x)  +  {x  +  l)y'(x)  -  2 y(x)  =  (1  -  x2)  e~x , 


®  e  [0,1];  3/(0)  =  3/(1)  =  0. 


Vamos  a  resolverlo  utilizando  el  método  de  disparo  lineal  con  h  =  0.2. 

Las  funciones  p,  q  y  r  son  respectivamente  p(x)  =  —(x  +  1),  q{x)  =  2  y  r(x)  =  (1  —  x2)  e~x.  La  solución 
numérica  del  problema  anterior  es: 


(7.5) 


y(x)  =  yi(x)  -  y2(x), 

donde  y\(x)  e  3/2 (aj)  son  las  soluciones  respectivas  de  los  PVI: 

Vi{x)  =  ~(x  +  l)y[(x)  +23/1(2)  +  (1  -  x2)e~x-,  j/i(0)  =  y[(0)  =  0, 

2/2  W  =  -(x+  l)y'2{x)  +2y2{x)\  y2(  0)  =  0,  y'2(0)  =  1, 

que  los  expresamos  ahora  respectivamente  de  la  forma: 

(  u[(x)  =  u2(x);  u r(0)  =  0, 

\  v!2{x)  =  2 ui(x)  —  (x  +  l)u2(x)  +  (1  —  x2)  e_x;  112(0)  =  0,  x  £  [0, 1], 

(  v[(x)  =  V2(x);  ^i(0)  =  0, 

\  v'2(x)  =  2vi(x)  —  (x  +  l)v2{x)-,  n2(0)  =  1,  xg  [0,1]. 

Utilizamos  el  método  RK4  para  construir  las  soluciones  numéricas  u\  y  vj  de  los  sistemas  lineales  (7.6)  y 
(7.7 1.  Las  aproximaciones  de  u y  vj  están  dadas  en  la  tabla 


(7.6) 


(7.7) 


7.1 


(véase  [Tü]b 


X 

“i 

v\ 

0 

0 

0 

0.2 

0.01743428 

0.18251267 

0.4 

0.06017154 

0.33919207 

0.6 

0.11620204 

0.48140428 

0.8 

0.17679396 

0.61776325 

1 

0.23633393 

0.75454368 

Tabla  7.1:  Soluciones  numéricas  de  los  sistemas  ( 7.6  I  y  d7J|. 

Por  ejemplo,  utilizando  ÍÜ  y  la  tabla |7.l[  la  solución  aproximada  en  x  =  0.4  es 

3/(0. 4)  =  3/1  (0.4)  -  y2(0.4)  w  0.06017154  -  ° (0.33919207)  =  -0.046068294.  □ 


2/2(1) 


0.75454368 
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Comentario  adicional.  >  En  general,  si  u]  y  v]  son  aproximaciones  respectivas  de  yi(xi)  e  y2 (xí)  con 
una  precisión  de  orden  0(hn),  para  cada  i  =  0,1,...,  TV,  entonces  la  aproximación  de  y(xj)  tendrá 
también  una  precisión  de  orden  0(hn). 


7.4.  Métodos  de  diferencias  finitas  lineales 


El  método  de  disparo  lineal  suele  presentar  problemas  con  los  errores  de  redondeo.  Los  métodos  que 
presentamos  en  esta  sección  son  más  robustos  frente  a  los  errores  de  redondeo,  pero,  en  general,  requieren 
mayor  esfuerzo  computacional  para  obtener  una  precisión  específica. 

Los  métodos  que  utilizan  diferencias  finitas  para  resolver  problemas  de  contorno  sustituyen  cada  una  de 
las  derivadas  de  la  EDO  por  un  cociente  incremental  como  los  considerados  en  el  capítulo  4;  los  cocientes 
increméntales  concretos  que  se  tomen  deben  mantener  un  orden  del  error  especificado.  Así,  los  métodos  que 
involucran  diferencias  finitas  transforman  el  PVF  en  un  sistema  lineal  o  no  lineal,  cuadrado,  cuyas  incógnitas 
serán  los  valores  aproximados  de  la  solución  y{x)  en  los  puntos  elegidos  del  intervalo  [a,  b\. 

En  el  método  de  diferencias  finitas  para  el  PVF  ( 7.4 1  es  necesario  utilizar  cocientes  increméntales 
para  aproximar  tanto  y'  como  y" .  Para  cualquier  x  del  intervalo  (a,  b),  sencillas  manipulaciones  del  desarrollo 
de  Taylor  de  y  (ir),  alrededor  de  x,  nos  permite  obtener  la  diferencia  finita  centrada  para  y'  (véase  el  capítulo 
4): 

y{x  +  h)  -  y{x  -  h) 


y'{x)  ~ 


2  h 


De  forma  análoga,  para  la  derivada  segunda,  obtenemos  la  diferencia  finita  centrada  para  yh 

y(x  +  h)  -  2 y(x)  +  y(x  -  h ) 


y"(x)  es 


h 2 


Sustituyendo  entonces  las  diferencias  finitas  centradas  que  acabamos  de  ver  en  la  EDO,  resulta 

y{ x  +  h)  -  2y(x)  +  y(x  —  h)  y(x  +  h)-y(x-h) 

- =  p{x) - V7 - f  q{x)y{x)  +  r(x). 


h2 


2  h 


(7.8) 


Tomando  ahora  un  número  entero  TV  >  0  y  dividiendo  el  intervalo  [a,  b }  en  (TV  +  1)  subintervalos  del  mismo 
tamaño  h,  con 

h=  ^  m  i  Xi  =  a  +  ih,  i  =  0, 1, . . .  ,TV  +  1, 


podemos  discretizar  la  expresión  ( 7.8 1  para  cada  de  manera  que 

„(*,„) - 2v{xt)  +  ÍÉíV  =  „(x() ^+.>Vfa-i>  +  ,(*)„(*,)  +  rt*),  ;  =  1,2 . ¡V. 


h 2 


2  h 


Si  utilizamos  la  notación  u¿  =  y{x{),  Pi  =  p{x{),  qt  =  q{xi )  y  r¡  =  r(a;¿),  con  i  =  1,2,...,  TV,  uq  =  ay 
un+ i  =  (3,  y  agrupamos  términos,  obtenemos  el  sistema  lineal  de  tamaño  TV  x  TV 


(1  +  ~  +  h2<li ^  Ui  +  (1  _  Ui+1  =  h2ril  i  =  1;  2’ ' ' '  ’ N’ 


(7.9) 


que  se  puede  representar  en  la  forma  matricial  Au  =  b,  donde  A  es  una  matriz  TV  x  TV  tridiagonal, 

í  ui  \ 

U2 
C3 


(bl 

a2 


c  i 
b2 

«3 


\ 


C2 

^3 


ojv-i  bN_  i  Cjv-i 
dN  bN  ) 


UN-1 

\  un  ) 


(di  —  a\a  \ 

d2 
d-.i 


div-i 
\dw  —  cnPJ 
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donde  a¿,  c¿  y  están  definidos,  para  i  =  1,  2, . . . ,  N,  por 


a*  —  1  "h  2 Pii  —  (2  +  /i  9¿),  U  —  1  2^*’  ^7  —  h  Ti. 

Este  sistema  tiene  solución  única  si  p,  q  y  r  son  continuas  en  [a,  6],  g(:r)  >  0  en  [a,  fc]  y  ft  <  2/L,  donde 
L  =  máx  |»(a;)|. 

a<x<b 


Ejemplo.  Sea  el  PVF 


2/"(z)  +  (x+  l)j/'(a?)  -  2y(a:)  =  (1  -  x2)  e  x,  a;  €[0,1];  y(0)  =  -1,  y(l)  =  0. 


Utilizaremos  el  método  de  diferencias  finitas  lineales  con  h  =  0.2  para  resolverlo  y  compararemos  los  resultados 
con  la  solución  exacta  y(x)  =  (x  —  1)  e~x. 

Las  funciones  p1  q  y  r  son  respectivamente  p(x)  =  —{x  +  1),  q( x)  =  2  y  r(x )  =  (1  —  x2)  e~x.  Por  tanto,  la 
ecuación  ( 7.9 1  se  convierte  en 

(1  -  0.lO¿  +  l))uj_i  -  (2  +  0.08)  u¿  +  (1  +  0.1(*i  +  l))«i+i  =  0.04(1  -  x2)  e~x\ 
con  uq  =  — 1,  r¿5  =  0  y  Xi  =  (0.2)*,  para  i  =  1,  2,  3, 4.  Y  la  correspondiente  formulación  matricial  es 


V 


1.12  \ 

/0.91143926\ 

-2.08  1.14 

U2 

0.02252275 

0.84  -2.08  1.16 

Us 

0.01404958 

0.82  —2.08/ 

\uj 

\0. 00647034/ 

(7.10) 


Las  aproximaciones  de  la  solución  aparecen  en  la  tabla  7.2  (véase  m),  junto  con  su  comparación  con  los 
valores  calculados  a  partir  de  la  solución  analítica.  □ 


X 

tt¿ 

y(xi) 

Error  absoluto 

0 

-1.00000 

-1.00000 

0.000000 

0.2 

-0.65413 

-0.65498 

0.000854 

0.4 

-0.40103 

-0.40219 

0.001163 

0.6 

-0.21848 

-0.21952 

0.001047 

0.8 

-0.08924 

-0.08987 

0.000624 

1 

0.00000 

0.00000 

0.000000 

Tabla  7.2:  Solución  numérica  del  sistema  (7.10). 


Comentarios  adicionales.  >  De  la  aplicación  de  los  métodos  de  diferencias  finitas  no  siempre  resulta 
un  sistema  tridiagonal  de  ecuaciones.  Esto  último  es  debido  a  que  la  EDO  es  de  segundo  orden  y  se  ha 
utilizado  una  fórmula  de  diferencias  finitas  centradas  para  aproximar  la  derivada  segunda. 

>  Obsérvese  que  al  utilizar  diferencias  finitas  centradas  como  aproximaciones  de  las  derivadas,  resulta 
que  el  método  de  diferencias  finitas  tendrá  un  error  de  truncamiento  de  orden  0(h2).  Para  obtener 
un  método  de  diferencias  más  preciso  tenemos  varias  opciones.  Podemos  utilizar  aproximaciones  en 
diferencias  finitas  más  precisas  para  las  derivadas,  pero  la  desventaja  de  hacer  esto  es  que  el  sistema  de 
ecuaciones  resultante  no  será  tridiagonal  y  su  resolución  requerirá  entonces  muchas  más  operaciones. 
Otro  camino,  generalmente  más  satisfactorio,  consiste  en  considerar  una  reducción  del  tamaño  de  paso 
h  y  comparar  las  soluciones  en  los  mismos  nodos;  sin  embargo,  el  error  de  redondeo  incrementará  y 
podría  llegar  a  hacerse  grande. 
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7.5.  El  método  de  disparo  no  lineal 

Los  métodos  de  diferencias  finitas  trabajan  razonablemente  bien  para  PVF  lineales  y  no  presentan  pro- 
bemas  de  inestabilidad.  Para  PVF  con  EDO  no  lineales,  estos  métodos  suelen  presentar  problemas  como 
consecuencia  de  que  el  sistema  resultante  es  no  lineal.  En  tales  situaciones  es  preferible  utilizar  el  método 
de  disparo  no  lineal. 

La  técnica  del  disparo  para  un  PVF  no  lineal 

y"(x)  =  f(x,y(x),y'(x)),  x€[a,b];  y  (a)  =  a,  y(b)  =  0,  (7.11) 

es  parecida  a  la  del  método  de  disparo  lineal,  salvo  que  la  solución  de  un  problema  no  lineal  no  puede 
expresarse  como  una  combinación  lineal  de  soluciones  de  dos  PVI.  En  su  lugar,  aproximamos  la  solución  del 
PVF  mediante  las  soluciones  de  una  sucesión  de  PVI  de  la  forma 


y'\x)  =  f{x,y(x),y\x)),  x£[a,b\;  y(a)  =  a,  y'{a)  =  m, 


(7.12) 


que  involucran  un  cierto  parámetro  m,  que  indicará  la  pendiente  de  salida  de  la  solución  del  problema  (de 
ahí  el  nombre  de  método  de  disparo  para  esta  técnica,  que  viene  de  la  analogía  con  el  procedimiento  para 
disparar  contra  un  blanco  fijo,  véase  m)-  Para  ello,  elegiremos  valores  rrik  del  parámetro  m  de  manera  que 
se  garantice 

lím  y(b;  mk)  =  y(b)  =  0, 

K — KJO 


donde  y(x\  mk)  denota  la  solución  del  PVI  (7.121  con  m  =  mk  e  y{x)  la  solución  del  PVF  (7.11 1.  Observemos 
que  y{x\mk)  satisface  todas  las  condiciones  para  ser  la  solución  del  PVF  (7.111,  a  falta  de  que  su  valor  en 
x  =  b  sea  0. 

Iniciamos  el  proceso  con  un  valor  del  parámetro  m  =  mo  que  determina  la  elevación  con  la  que  se  dispara 
desde  el  punto  (a,  a),  de  manera  que  la  trayectoria  de  la  bala  viene  dada  por  la  solución  del  PVI 

y"(x)  =  f(x,y(x),y'(x)),  xe[a,b)\  y(a)  =  a,  yl(a)  =  m0. 

Si  y(b ;  rao)  no  está  suficientemente  cerca  de  0,  corregimos  nuestra  aproximación  tomando  una  nueva  elevación 
mi,  77i2, . . .,  y  así  sucesivamente  hasta  que  y(b\  mk)  «acierte»  en  0  con  la  precisión  deseada. 

El  problema  es  entonces  determinar  el  parámetro  m  del  PVI  de  manera  que 

y(b;  m)  -  0  =  0 

(es  decir,  se  trata  de  resolver  la  ecuación  anterior  en  la  variable  vi).  Por  tanto,  todo  se  reduce  a  resolver  una 
ecuación  no  lineal,  descrita  por  una  función  de  la  que  solo  conocemos  su  valor  en  una  serie  de  puntos,  para 
lo  cual  se  puede  aplicar  cualquier  método  numérico  de  los  descritos  en  el  capítulo  2.  Por  ejemplo,  podemos 
recurrir  al  método  de  bisección,  al  de  la  secante  o  al  de  Newton.  Pero  el  empleo  de  un  método  u  otro  necesitará 


de  un  mayor  o  menor  conocimiento  de  la  solución  de  (7.121  y,  quizá,  de  alguna  derivada,  lo  cual  puede  hacer 
complicada  su  aplicación. 

Un  método  sencillo  que  se  puede  utilizar  para  determinar  el  parámetro  m  es  el  método  de  la  secante, 
para  el  que  se  necesita  dar  dos  valores  iniciales  too  y  mi  y  hallar  las  siguientes  aproximaciones  mediante  la 
iteración 

TOfc  =  m.fc_i  -  (y{b;  mk- 1)  -  0)  ,  rnk~1 — - -  k  =  2,3...  (7.13) 

y{b;  TOfe_i)  -  y(b ;  mfc_2) 

A  continuación,  conocido  el  valor  de  mk  en  la  fc-ésima  iteración,  se  vuelve  a  resolver  el  PVI  ( 7. 12|)  para 


m  =  mk  y,  mediante  (7.13)  con  k  =  k  +  1,  se  obtiene  un  nuevo  valor  de  la  pendiente  de  disparo  m  =  mk+i- 


Y  así  hasta  alcanzar  un  mj  tal  que  \y(b:  nij)  —  0\  <  e,  donde  e  es  la  cota  del  error  que  estemos  dispuestos 
a  cometer.  Notemos  que  para  que  el  método  converja,  son  necesarias  buenas  elecciones  de  mo  y  m±.  La 
convergencia  del  método  de  la  secante,  en  condiciones  adecuadas,  asegura  la  convergencia  del  método  de 
disparo  no  lineal. 


En  la  práctica,  ninguno  de  los  PVI  (7.121  se  resuelve  exactamente,  sino  que  sus  soluciones  se  aproximan 


utilizando  alguno  de  los  métodos  numéricos  tratados  en  el  capítulo  anterior. 
Ejemplo.  Consideremos  el  PVF 


yy 


=  -(y’)2,  se  [1,3];  y(l)  =  y/2,  y( 3)  =  2, 


7.6.  MÉTODOS  DE  DIFERENCIAS  FINITAS  NO  LINEALES 
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cuya  solución  exacta  es  y  =  \/l  +  x.  Para  este  ejemplo,  f(x,  y,  y')  =  —  {y')2 /y,  a  =  1,  b  =  3,  a  =  \¡2  y  (3  =  2. 

Para  aplicar  el  método  de  disparo  no  lineal  para  resolver  este  problema  con  una  precisión  de  10~6,  podemos 
tomar  como  primera  aproximación  itlq  =  y(  1)  =  \/2  ~  1.4  y  reemplazar  el  PVF  por  el  PVI 

yy"  =  -(y')\  ®e[i,3];  y(i)  =  V2,  y\i)  =  iA. 

Transformamos  ahora  la  EDO  anterior  en  un  sistema  de  primer  orden  de  dos  EDO,  ajustamos  las  condiciones 
iniciales  al  sistema  y  aplicamos  a  cada  EDO  individual  el  método  RK4  para  obtener 


y(3;  too)  =  3.14953128,  \y(3;  m0 )  -  2|  =  1.14953128. 


Repetimos  el  proceso  utilizando  una  estimación  diferente  de  y'{  1);  por  ejemplo,  mi  =  =  2  ^f2  «  0.3,  de 

manera  que 

2/(3;  mi)  =  1.92277306,  \y(3;  m, )  -  2|  =  0.07722694. 

Para  la  tercera  aproximación  utilizamos  el  método  de  la  secante 


(1.92277306  -  2)(0.3  -  1.4) 
1.92277306  -  3.14953128 


0.30629520 


y  obtenemos 

2/(3;  m2)  =  2.02207265,  |í/(3;  m2)  -  2|  =  0.02207265. 

Se  repite  el  proceso  para  calcular  las  siguientes  y(3;m,k)-  Después  de  seis  intentos,  véase  ¡TU¡.  se  obtiene  el 
valor  m5  =  0.35355340  para  el  que  y( 3;  m3)  =  2  hasta  10  cifras  decimales.  □ 

Comentario  ADICIONAL.  >  Análogamente,  se  puede  utilizar  el  método  de  Newton  para  hallar  una  so¬ 
lución  aproximada  de  la  ecuación  y(b ;  m)  —¡3  =  0  en  cada  iteración,  pero  la  necesidad  de  conocer  la 
derivada  de  la  solución  en  la  iteración  anterior  lleva  consigo  tener  que  resolver  un  nuevo  PVI,  aunque 
generalmente  converge  más  rápidamente  que  utilizando  el  método  de  la  secante.  Ambos  métodos  pre¬ 
sentan  solo  convergencia  local,  ya  que  ambos  requieren  buenas  aproximaciones  iniciales.  (Véanse  [Si,  (71  [8 
para  la  resolución  mediante  el  método  de  Newton.) 

Nota.  Debido  a  la  complejidad  de  estudio  del  error  en  estos  métodos,  no  vamos  a  indicar  nada  sobre  el 
mismo.  Para  un  estudio  detallado  de  error,  puede  consultarse  m- 


7.6.  Métodos  de  diferencias  finitas  no  lineales 


El  método  de  diferencias  finitas  para  un  PVF  general  ( 7.11|)  es  parecido  al  método  que  se  aplica  en  los 
problemas  lineales,  excepto  que  el  sistema  de  ecuaciones  resultante  es  no  lineal,  y  habrá  que  recurrir  a  los 
métodos  numéricos  correspondientes  para  su  resolución.  Véase  ¡3]. 

Al  igual  que  en  el  caso  lineal,  dividimos  el  intervalo  [a,  b]  en  N  +  1  subintervalos  cuyos  extremos  son  los 
nodos  Xi  =  a  +  ih ,  para  i  =  0,1, . . . ,  N  +1.  Suponiendo  que  la  solución  exacta  tiene  derivada  cuarta  acotada, 
podemos  aproximar  y'{x)  e  y"(x)  por  las  diferencias  finitas  centradas  adecuadas,  discretizar  la  expresión 
resultante  para  x  =  Xi,  i  =  1, 2, . . . ,  N,  y  obtener 


y{xi+ 1)  -  2'2/(x¿)  +  y{xi-\) 
h2 


=  f  Xi,y(xi ) 


y{xj+ 1)  -  y{xj- 1) 

2  h 


i=l,2,...,N. 


Para  generar  el  método  de  diferencias  finitas,  suprimimos  el  término  de  error  y  añadimos  las  condiciones  de 
contorno,  lo  que  transforma  el  PVF  en  el  sistema  no  lineal  de  tamaño  N  x  N 


2ui  -u2  +  h2f  (xi,ui,  i%fL)  - 
—Mi  +  2 U2  —  u3+  h2  f  (x2,  U2 


U3—UI 

2  h  , 


o 
o 


-Un-2  +  2ltjV— 1  -UN  +  h2f  (xAf_i,MjV_i,  UN  2uhN  2 )  =  0 

-UN- 1  +  2 itjv  +  h2f  (xat, uN,  "-1 )  -  p  =  0 
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donde  u3  =  a,  Ujv+i  =  (3  y  iq  representa  el  valor  aproximado  de  la  solución  y(x)  en  el  punto  x  =  a q.  Para 
aproximar  la  solución  del  sistema  anterior,  recurrimos  al  método  de  Newton  para  sistemas  no  lineales.  Se 


genera  entonces  una  sucesión  de  iteraciones  |  ■  ■  ■ ,  J  due  converge  a  la  solución  del  sistema 

suponiendo  que  la  aproximación  inicial  ui°\  . . . ,  ufflj  esté  lo  suficientemente  cerca  de  la  solución 


(ui,U2,  ■  ■  ■ ,  un)T ■  Si  denotamos  por  =  1+1  1  1 


método  de  Newton  es  la  matriz  tridiagonal 

(bi  Ci 


2  h 


J  = 


i  =  1,2 , . . . ,  TV,  la  matriz  jacobiana  que  aparece  en  el 

\ 


a2  b2  c2 
a3  b3 


c3 


ajv-i  bjv-i  cn-i 

V  bN  / 

donde  a¿,  y  c¿  están  definidos,  para  i  =  1,  2, . . . ,  N,  por 

IR  —  ( 1  T  ~  f y'  (x¿,  Uí ,  ¿q)  J  ,  bi  —  2  q -  h  f y  {^Xi ,  Uj, ,  Z¿)  ,  Ci  —  í  1  7 7  f y'  :  'U i ,  Z¿) 


El  método  de  Newton  para  sistemas  no  lineales  requiere  que,  en  cada  iteración,  se  resuelva  un  sistema  lineal 
N  x  N  con  la  anterior  matriz  tridiagonal  J  ( jü] ) 


(  VX  ^ 

V2 

VN-1 

V  vN  / 

■  ,VN)T 

nos 

2ui  -  u2  +  h2f  (xi,u1:  '%fL)  -  a  \ 

i  +  2u2  -  u3  +  h2f  (x2,  «a,  y^x) 

-mjv-2  +  2un_!  -un  +  h2f  (xn-í,  Un-1,  “''7rj 


— wjv— i  +  2un  +  h2f  (xN,  uN, 


donde  v  =  (iq,  v2, . . . ,  Vn)t  nos  permite  actualizar  la  iteración  del  método  de  Newton 

u«  =  u^-1)  +  V, 

con  . . . ,  .  Como  en  este  caso  la  matriz  J  es  tridiagonal,  podemos  aplicar  el  método 

de  factorización  de  Crout.  Las  aproximaciones  iniciales  ií,-0'1  de  tq,  para  cada  z  =  1,2,...,  TV,  son  las  ordenadas 
correspondientes  a  las  abcisas  aq  en  la  línea  recta  que  pasa  por  los  puntos  (a,  a)  y  (b,  /3). 

Se  puede  demostrar,  véase  CE  que  el  método  anterior  es  de  orden  0{h2). 

Como  es  posible  que  necesitemos  una  buena  aproximación  inicial,  debemos  establecer  una  cota  del  número 
de  iteraciones  y,  si  se  excede,  buscar  una  nueva  aproximación  o  disminuir  el  tamaño  de  paso. 

7.7.  Sugerencias  para  seguir  leyendo 

Para  la  teoría  básica  se  pueden  consultar  las  referencias  dadas  en  el  capítulo  anterior.  También  se  pueden 
consultar  los  siguientes  textos:  Keller  (1992),  Fox  (1990)  o  Golub  y  Ortega  (1992). 

7.8.  Ejercicios 

1.  Denuéstrese  que  los  siguientes  PVF  tienen  solución  única 
a)  V "  =  (5 y  +  sen  3 y)  ex ;  y( 0)  =  y{  1)  =  0, 
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b)  y"  +  e  xy  +  sen  y'  =  0;  2/(1)  =  2/(2)  =  0. 

2.  Demuéstrese  que  el  PVF  lineal 

y"{x)  =  p(x)y'(x)  +  q(x)y(x)  +r(x),  x£[a,b\-,  y  (a)  =  a,  y(b)  =  ¡3, 

tiene  solución  única  si  p(x),  q(x)  y  r(x)  son  continuas  en  [a,  b]  y  q(x)  >  0  en  [a,  b}. 

3.  Apliqúese,  usando  el  método  de  Euler  con  paso  h  =  0.5  para  los  PVI  asociados,  el  método  de  disparo 
lineal  para  aproximar  la  solución  del  PVF 

y11  =  exy  +  (1  +  x)y'  +  x3-,  2/(0)  =  0,  2/(1)  =  2. 

4.  Escríbase  la  ecuación  en  diferencias  lineales  con  N  =  9  que  aproxima  la  solución  del  PVF 

y"  +  3j/  +  2y  =  4x2;  y(  1)  =  1,  y(  2)  =  6. 

5.  Pruébese  que  el  sistema  lineal  Au  =  b,  donde  A  es  una  matriz  N  x  N  tridiagonal,  correspondiente  al 

método  de  diferencias  finitas  lineales,  tiene  solución  única  si  p,  q  y  r  son  continuas  en  [a,  6],  q{ x)  >  0  en 
[a,b\y  h  <  ■£,  donde  L  =  m  áxa<x<b  |p(a;)|.  (Ayuda:  pruébese  primero  que  A  es  una  matriz  estrictamente 
diagonal  dominante.) 

6.  Supongamos  que  p(x)  =  C\  >  0  y  q(x)  =  Ci  >  0. 

a)  Escríbase  el  sistema  lineal  que  representa  al  método  de  diferencias  finitas  lineales  para  esta  situa¬ 
ción. 

b)  Prúebese  que  el  sistema  tiene  solución  única  si  ¿A  <  h. 

7.  Utilícese  el  método  de  diferencias  finitas  lineales  con  h  =  \  para  aproximar  la  solución  del  PVF 

y"  =  4 (y  -  x)\  y(0)  =  0,  2/(1)  =  2. 

Compárense  los  resultados  con  la  solución  exacta  y(x)  =  e2(e4  —  l)~1(e2x  —  e~2x)  +  x. 

8.  Si  aplicamos  el  método  de  disparo  no  lineal  al  PVF 

y"  =  ^2(y'f-,  2/(0)  =  1,  2/(1)  =  i.5, 

2  y 

y  obtenemos  los  siguientes  resultados 

2/(0)  =  0  =>  2/(1)  =  1.54308,  2/(0)  =  -0.005  =>  y(l)  =  1.42556, 

¿qué  valor  de  y'( 0)  debería  utilizarse  en  el  siguiente  disparo? 

9.  Sea  el  PVF 

y"  =  ~(y')2  —  2/  +  ln  x\  2/(1)  =  o,  2/(2)  =ln  2. 

a)  Disparando  con  mo  =  0  y  mi  =  1,  utilícese  el  método  de  disparo  no  lineal  (usando  como  método 
para  los  PVI  asociados  el  método  de  Euler  con  paso  h  =  0.5)  para  calcular  las  dos  primeras 
correcciones  al  disparo  inicial  (m.2  y  m.3),  y  aproxímese  la  solución  del  PVF  con  disparo  1TI3. 

b)  Mediante  el  método  de  diferencias  finitas  no  lineales  con  h  =  0.5,  aproxímese  la  solución  del  PVF. 

c)  Compárense  los  resultados  con  la  solución  exacta  y(x)  =  ln  x. 

10.  Utilícese  el  método  de  disparo  no  lineal  con  h  =  0.25  para  aproximar  la  solución  del  PVF 

y"  (x)  —  y'(x)  +  2(y(x)  —  lna:)3  —  — ;  y(2)  =  ]-+\n2,  J/(3)  =  ^+ln3, 

x  2  3 

disparando  con  mo  =  y  mi  =  mo  +  l3~v^nA  _  Compárense  los  resultados  con  y(x)  =  y  +  lnx. 
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11.  Aproxímese  la  solución  del  PVF 

y"{x)  =  2y(x)3;  y{- 1)  =  7/(0)  = 

mediante  el  método  de  diferencias  finitas  no  lineales  con  h  =  0.25.  Compárense  los  resultados  con  la 
solución  exacta  y(x)  —  x(¡_3 . 

12.  Condiciones  de  contorno  de  Neumann.  Las  condiciones  de  contorno  que  aparecen  en  los  PVF  se  pueden 
especificar  de  diferentes  maneras.  Si  en  vez  de  ser  dos  valores  de  y ,  son  dos  valores  de  y'  de  la  forma 
y' {a)  =  a  e  y'(b)  =  /?,  hablaremos  de  condiciones  de  contorno  de  Neumann.  En  estos  problemas,  los 
métodos  de  diferencias  finitas  se  utilizan  para  aproximar  la  EDO  en  los  puntos  interiores.  Sin  embargo, 
el  sistema  algebraico  que  se  obtiene  no  se  puede  resolver  porque  la  solución  en  los  puntos  extremos 
no  está  dada  (luego  hay  más  incógnitas  que  ecuaciones).  Las  ecuaciones  adicionales  necesarias  para 
resolver  el  problema  se  obtienen  aproximando  las  condiciones  de  contorno  mediante  diferencias  finitas  e 
incorporando  las  ecuaciones  resultantes  a  las  ecuaciones  algebraicas  obtenidas  para  los  puntos  interiores. 
Apliqúese  lo  anterior  al  PVF 

y"(x)  +  ^  y'(x)  =  i;  s/(0)  =  0,  y'(l)  =y(l)  +  y(l)4 

utilizando  diferencias  finitas  centradas  y  asegurándose  de  que  el  orden  del  error  de  truncamiento  de  las 
condiciones  de  Neumann  es  compatible  con  el  de  la  EDO. 


13.  Condiciones  de  contorno  mixtas.  Si  las  condiciones  de  contorno  son  de  la  forma  y'(a)  +  ciy(a)  =  a  e 
y' (6)  +  C2y(b)  =  (3,  donde  Ci  y  C2  son  constantes,  reciben  el  nombre  de  condiciones  de  contorno  mixtas. 
Aproxímese  el  PVF 

y"{x)  =  y{x)  +  ex;  y(  0)  =  1,  t/(1)  =  -1 


utilizando  diferencias  finitas  centradas  para  todas  las  derivadas  y  dividiéndose  el  dominio  de  inte¬ 
gración  en  cinco  subintervalos.  Compárense  los  resultados  numéricos  con  la  solución  exacta  y (x)  = 

1— c  —  e2  X  I  e(l+2  e)  —x\_x  x 
1+c2  e  "r"  1+e2  e  t2e  ' 

14.  Si  la  EDO  lineal  y"{x)  —  p(x)y'(x)  —  5(2)22(2)  =  r(x)  está  sujeta  a  las  condiciones  contorno  y(a)  =  a  e 
y'(b)  +  cy(b )  =  /3,  la  combinación  lineal  y{ x)  =  2/1(2)  +  212/2(2),  donde  y\{x)  es  la  solución  del  problema 
(7.1)  e  2/2(2)  la  del  problema  (7.2),  satisface  la  condición  y(a)  =  a.  Si  queremos  aplicar  el  método  del 
disparo  lineal,  necesitamos  encontrar  y  para  que  y(x)  satisfaga  y'(b)  +  cy{b )  =  ¡3.  Si  y^ib)  +  07/2(6)  7^  0, 
hay  una  única  solución  dada,  la  dada  por 


y(x)  =  2/1(2)  + 


P-y’i(b)  —  cy\(b) 
y'2{b)  +  cy2(b) 


1/2(2). 


Si  por  el  contrario  2/2(6)  +  02/2(6)  =  0,  es  fácil  ver  que  y(x)  =  2/1(2)  satisface  ambas  condiciones  de 
contorno.  Aproxímese  entonces  la  solución  del  PVF  del  ejercicio  anterior  utilizando  el  método  de  disparo 
lineal. 


15.  Para  poder  aproximar  la  solución  del  PVF 

2/" (2)  -  p{x)y\x)  -  5(2)22(2)  =  r(x);  y1  (a)  +  Ciy{a)  =  a ,  y’{b)  +  c2y(b)  =  ¡3, 

mediante  el  método  del  disparo  lineal,  los  dos  PVI  que  hay  que  resolver  son: 

y"(x)=p{x)y'(x)  +  q{x)y{x)  +  r{x),  2<E[a,6];  y(a)  =  0,  y'{a)=a, 

y” (2)  =  p{x)y’(x)  +  5(2)22(2),  2  e  [a,  6];  y(a)  =  1,  y’ (a)  =  -Ci. 

La  combinación  lineal  y(x)  =  2/1(2)  +  ^2/2(2),  donde  2/1(2)  es  la  solución  del  primer  PVI  e  2/2(2)  la  del 
segundo,  satisface  la  condición  y' (a)  +  Ciy(a)  =  a.  Necesitamos  entonces  encontrar,  si  es  posible,  y,  para 
que  2/(2)  satisfaga  y'{b)  +  C2y(b)  =  (3.  Si  2/2(6)  +  C22/2(6)  yf  0,  hay  una  única  solución  dada,  la  dada  por 

7/(2)  =  7/1  (*)  +  ^2/1(6)  {x) 

V[)  Vl{)+  24(6)  +  C22/2(6)  MX) • 
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Apliqúese  lo  anterior  para  aproximar  la  solución  del  PVF 

y"(x)  +y'(x)  +  y(x)  =  5x;  y'(0)  +  3y(0)  =  7,  7y'(l)  +  y(l)  =  8, 

mediante  el  método  de  disparo  lineal. 

16.  Los  problemas  relacionados  con  el  campo  de  la  elasticidad  y  la  vibración  se  ubican  en  una  clase  especial 
de  PVF  denominada  problemas  de  valores  propios.  Algunos  ejemplos  de  este  tipo  de  PVF  son  los  que 
aparecen  a  continuación. 

a)  y"  +  \y  =  0;  y( 0)  =  y(  1)  =  0, 

b)  y ”  +  Ay  =  0;  y'(0)  =  y(l)  =  0, 

c)  y"  -  2 y’  +  (1  +  A )y  =  0;  y(0)  =  0,  y(l)  =  0. 

Determínense  los  valores  de  A  para  los  cuales  existen  soluciones  no  triviales  (y  ^  0)  y  escríbanse  éstas 
en  función  de  A. 


Capítulo  8 


Métodos  numéricos  para  ecuaciones 
en  derivadas  parciales 

8.1.  Introducción 

Dedicamos  este  capítulo  a  presentar  una  breve  introducción  de  algunas  de  las  técnicas  que  aproximan  las 
soluciones  de  EDP  de  segundo  orden  con  coeficientes  constantes  y  dos  variables  independientes,  mostrando 
cómo  pueden  aplicarse  estas  técnicas  a  ciertos  problemas  físicos  bien  conocidos.  Estas  ecuaciones,  como 
bien  sabemos,  son  de  tipo  elíptico,  parabólico  o  hiperbólico.  El  ejemplo  típico  de  ecuación  elíptica  es  la 
ecuación  de  Laplace  (potencial)  para  la  distribución  de  la  temperatura  en  estado  de  equilibrio  en  una  región 
bidimensional,  el  de  ecuación  parabólica  es  la  ecuación  del  calor,  que  describe  la  distribución  de  temperatura 
en  una  varilla  fina,  y  el  de  ecuación  hiperbólica  es  la  ecuación  de  ondas  para  una  cuerda  vibrante.  Las  técnicas 
numéricas  para  resolver  estas  EDP  son  principalmente  de  dos  tipos:  métodos  de  diferencias  finitas  y  métodos 
de  elementos  finitos. 

Comenzaremos  describiendo  los  métodos  numéricos  basados  en  la  aproximación  por  diferencias  finitas, 
que  son  de  dos  tipos:  explícitos  e  implícitos.  En  los  primeros,  las  incógnitas  se  van  calculando  sucesivamente, 
en  términos  de  valores  conocidos  o  variables  ya  calculadas.  En  los  segundos,  hay  que  resolver  un  sistema  de 
ecuaciones  en  cada  paso  para  determinar  las  incógnitas.  Los  aplicaremos  a  las  ecuaciones  elípticas,  parabólicas 
e  hiperbólicas  utilizando  respectivamente  la  ecuación  de  Laplace,  la  ecuación  del  calor  y  la  ecuación  de 
ondas  como  ejemplos.  Las  técnicas  aquí  desarrolladas  se  basan  en  reemplazar  las  derivadas  parciales  por 
aproximaciones  en  diferencias  finitas  que  conducen  a  un  sistema  de  ecuaciones  algebraicas  para  los  valores 
de  la  función  incógnita  en  una  colección  de  puntos. 

Terminamos  la  lección  con  una  breve  introducción  al  método  de  los  elementos  finitos  (abreviadamente, 
MEF).  Una  ventaja  de  este  método  sobre  los  métodos  de  diferencias  finitas  es  la  relativa  facilidad  con  que  se 
manejan  las  condiciones  de  contorno  del  problema.  Muchos  problemas  físicos  tienen  condiciones  de  contorno 
que  incluyen  derivadas  y  se  formulan  sobre  regiones  cuya  frontera  es  una  curva  irregular.  Condiciones  de 
contorno  de  este  tipo  son  difíciles  de  manejar  utilizando  técnicas  de  diferencias  finitas  porque  en  cada  condición 
de  contorno  que  incluya  una  derivada,  ésta  se  debe  aproximar  mediante  un  cociente  incremental  en  una  malla 
de  puntos  y  la  irregularidad  de  la  frontera  hace  que  sea  difícil  situar  los  puntos  de  la  malla.  En  el  MEF  las 
condiciones  de  contorno  aparecen  como  integrales  en  un  funcional  que  se  debe  minimizar,  de  manera  que 
el  procedimiento  de  construcción  es  independiente  de  la  condición  de  contorno  concreta  de  cada  problema. 
Ilustraremos  este  método  con  la  ecuación  de  Laplace. 


8.2.  Métodos  de  diferencias  finitas  para  ecuaciones  elípticas 

La  EDP  elíptica  que  vamos  a  considerar  es  la  ecuación  bidimensional  de  Laplace: 

Uxx  T  V'yy  “  d 
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sobre  el  dominio  rectangular  1Z=  {(x,  y)/  a  <  x  <  b,  c  <  y  <  d}  y  sujeta  a  las  condiciones  de  contorno 

u(x,c)  =  fi(x),  u(x,d)  =  f2(x),  a<x<b1 
u{a,y)  =  gi(y),  u(b,y)  =  g2{y),  c  <  y  <  d. 

El  método  que  vamos  a  utilizar  es  una  adaptación  del  método  de  diferencias  finitas  para  problemas  de 
contorno  lineales  tratado  en  el  capítulo  6. 

En  primer  lugar,  tomamos  dos  números  naturales  n  y  m  y  definimos  los  tamaños  de  paso  h  y  k  mediante 
h  =  y  k  =  .  Dividimos  el  intervalo  [a,  6]  en  n  partes  iguales  de  anchura  h  y  el  intervalo  [c,  d)  en  m 

partes  iguales  de  anchura  k.  Esto  nos  permite  hacer  una  malla  cuadriculada  sobre  el  rectángulo  TZ  trazando 
líneas  verticales  y  horizontales  por  los  puntos  ( Xi,yj ),  donde 

Xi  =  a  +  ih ,  yj  =  c  +  jk ,  i  =  0,  j  =  0,  (véase  la  figura  [8T|. 


1 

»  4 

ym 

9  1 

f 

4 

9 

(yz 

.yi 

i 

o 

X 

o 

.xi 

>X3 

Xn  é 

L 

Figura  8.1:  Líneas  de  malla  y  puntos  de  malla. 


Las  líneas  rectas  x  =  Xi  e  y  =  ¡jj  se  llaman  líneas  de  malla  y  sus  intersecciones  puntos  de  malla  de  la 
cuadrícula.  Utilizando  en  cada  punto  de  malla  del  interior  de  la  cuadrícula  la  fórmula  de  Taylor  en  la  variable 
x  alrededor  de  x,¿ ,  generamos  la  fórmula  de  diferencias  centradas 

uxÁXuy¡)  =  «(*.-.,%) j/j)+»(»,+i.8i)  +  0{h2} 

Con  la  fórmula  de  Taylor  en  la  variable  y  alrededor  de  y-j  generamos  la  fórmula  de  diferencias  centradas 

..  /_  u(xi,yj-1)-2u(xi,yj)  +  u(xi,yi+1)  ,  ,nf,^ 

uyy\xi’>yj)  —  ^ 2  '  ). 

Sustituyendo  estas  fórmulas  en  la  ecuación  de  Laplace  y  eliminando  los  términos  de  error  0{h2)  y  0(k2), 
obtenemos  las  siguientes  ecuaciones 

u(xi+i,Vj)  -2u(xi,yj)  +  u(xi-1,yj)  u(xí,  yj+1)  -  2u(xí,  y¡)  +  u(x¿,  2/¿_i)  _ 

/i2  k2 

para  cada  i  =  1, 2, . . . ,  n  —  1  y  j  =  1, 2, . . . ,  m  —  1.  Las  condiciones  de  contorno  son 

u(xi,y0)  =  fi(xi),  u(xi,ym)  =  f2(xi),  i  =  1, 2, . . . ,  n  -  1, 

u(x0,yj)  =  gi(yj),  u(xn,yj)  =  g2(yj),  j  =  0,l,...,m. 

Si  denotamos  por  u,;j  las  aproximaciones  de  los  valores  u(xi,yj),  obtenemos  la  ecuación  en  diferencias 
que  define  el  método  de  diferencias  finitas  para  la  ecuación  de  Laplace  (véase  0),  cuyo  error  es  de 
orden  0(h 2  +  k 2): 


íi+i 


^Í,j  (^z—  l,j  “I- 


('U'iij  —  l  “1“  rU/i,j-\-l)  —  0} 


8.2.  MÉTODOS  DE  DIFERENCIAS  FINITAS  PARA  ECUACIONES  ELÍPTICAS 
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para  cada  i  =  1,  2, . . . ,  n  —  1  y  j  =  1, 2, . . . ,  m  —  1,  con 

Ui,0  =  fl(Xi),  ui:m  =  f2(xi),  i  =  1,2, . . .  ,n  -  1, 
uo,j  =  gÁVj),  unJ  =  g2{yj),  J  =0,1,...,  m. 


Una  ecuación  típica  relaciona  las  aproximaciones  de  u(x ,  y)  en  los  puntos 

(x%-i,yj),  (xí,  Vj),  (xi+1  ,yj),  (xi,yj-i)  y  {xi:yj+1). 


Si  reporducimos  la  porción  de  la  malla  en  la  que  se  localizan  estos  puntos  (véase  la  figura  8.2),  vemos  que 
cada  ecuación  relaciona  las  aproximaciones  en  una  región  estrellada  alrededor  de  ( Xi,yj ). 

u(x,d)  =  f2{x) 


u(a,y )  =  gi(y) 


(i  — U  j) 


(if j+1) 


(i.  j) 


(i.  j-1) 


(i+1/ j) 


u(b,y)  =  g2(y) 


u(x,c)  =  /i(x) 

Figura  8.2:  Forma  esquemática  para  el  método  de  diferencias  finitas  (ecuación  de  Laplace). 


Obsérvese  que  el  método  anterior  proporciona  una  sistema  lineal  (n  —  1  )(m  —  1)  x  (n  —  1  )(m  —  1),  cuyas 
incógnitas  son  las  aproximaciones  'Ut¿  de  u(xi,yj)  en  los  puntos  de  malla  interiores.  Este  sistema  es  de  gran 
tamaño  y  su  matriz  tiene  a  lo  sumo  cinco  elementos  no  nulos  en  cada  fila.  Para  un  uso  general,  las  técnicas 
iterativas  representan  a  menudo  la  mejor  aproximación  a  la  solución  de  tales  sistemas  de  ecuaciones.  Sin 
embargo,  si  el  número  de  ecuaciones  no  es  demasiado  grande  (del  orden  de  100  o  menor),  una  solución  directa 
de  estos  sistemas  es  práctica,  pues  el  hecho  de  que  la  matriz  sea  definida  positiva  asegura  su  estabilidad  frente 
a  los  errores  de  redondeo. 

Ejemplo.  Ilustramos  a  continuación  la  solución  de  la  ecuación  de  Laplace  cuando  n  =  m  =  4.  Consideremos 
el  problema  de  determinar  la  distribución  estacionaria  del  calor  en  una  fina  lámina  cuadrada  de  metal  de  2 
metros  de  lado.  Dos  lados  adyacentes  se  mantienen  a  300°C  y  200°C,  mientras  que  la  temperatura  en  los 
otros  dos  lados  se  mantiene  a  100°C  en  uno  y  en  el  otro  crece  linealmente  de  0°C  a  400°C  en  el  vértice  donde 
dichos  lados  se  encuentran.  El  problema  se  expresa  como 

^xx  ~b  ^"yy  =  0<X<2,  0  T/  2 , 


con 


u(: r,0)  =  300,  u(x,2)  =  100,  0  <  x  <  2, 

y)  =  200,  u( 2,  y)  =  200 y,  0  <  y  <  2. 


Tomando  n  =  m  =  4  para  este  problema  (h  =  k  =  0.5),  la  malla  resultante  se  muestra  en  la  figura  8.3 
la  correspondiente  ecuación  en  diferencias  es 


4  Uí,j  IR— i  i  1  —  0,  i  1,2,3,  j  1,2,3. 

Expresando  esto  y  etiquetando  fila  por  fila,  empezando  por  la  esquina  inferior  izquierda,  los  valores 
desconocidos  Ui¿  en  los  nueve  puntos  interiores  de  la  malla  por  v\,  v2,  ■  ■  ■ ,  vg,  obtenemos  que  el  sistema  lineal 
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lt(0,  y)  =  200 


u(x,  2)  =  100 


v7 

V8 

v9 

v4 

>vs  1 

,V6 

Vi 

V2 

,V3 

«(2,  y)  =  200y 


u( x,  0)  =  300 

Figura  8.3:  Malla  de  orden  5x5  para  una  ecuación  de  Laplace  del  ejemplo. 


asociado  al  problema  es 


/  4  -1  0-1  0  0  0 

-1  4-1  0-1  0  0 

0-1  4  0  0-1  0 

-1  0  0  4  -1  0  -1 

0-1  0-1  4-1  0 

0  0-1  0-1  4  0 

0  0  0  -1  0  0  4 

0  0  0  0  -1  0  -1 

\00000  -1  0 


0  0  \ 
o  o 
o  o 
o  o 
-1  o 
0  -1 
-1  o 

4  -1 

-1  4  J 


(  «1  ^ 
«2 
v:í 
va 
v5 
v& 

v7 

vs 

\  Vg  J 


/  «0,1  +  Til, o 
«2,0 
«3,0  +  «4,1 
«0,2 

«4,2 
«0,3  +  «1,4 
«2,4 

\  «4,3  +  «3,4 


500  \ 
300 
400 
200 
0 

200 
300 
100 
400  / 


donde  el  vector  de  los  términos  independientes  se  ha  calculado  utilizando  las  condiciones  de  contorno. 

Utilizando  el  método  de  eliminación  de  Gauss,  véase  m,  la  temperatura  en  los  puntos  interiores  de  la 
malla  es 

«i  =  233.929,  v2  =  235.714,  v3  =  208.929, 

«4  =  200.000,  «5  =  200.000,  v6  =  200.000, 

«7  =  166.071,  «8  =  164.286,  v9  =  191.071. 

Por  supuesto,  con  un  número  tan  pequeño  de  puntos  de  malla  no  se  puede  esperar  una  exactitud  alta.  Si 
elegimos  un  valor  de  h  más  pequeño,  la  exactitud  debería  mejorar.  La  figura  |8.4|  muestra  la  aproximación 
numérica  anterior  de  la  solución.  □ 


8.3.  Métodos  de  diferencias  finitas  para  ecuaciones  parabólicas 


Un  ejemplo  clásico  de  EDP  parabólica  es  la  conocida  ecuación  del  calor,  o  de  la  difusión, 

Ut  =  (3uxx,  para  0  <  x  <  í  y  í>0, 


con  las  condiciones 

z¿(0,t)  =  u(l,  t)  =  0,  t  >  0,  (condiciones  de  contorno), 
u(x,  0)  =  f(x),  0  <  x  <  í,  (condición  inicial). 

El  enfoque  que  vamos  a  utilizar  para  aproximar  la  solución  de  este  problema  emplea  diferencias  finitas  de 
una  manera  parecida  a  como  lo  hemos  hecho  en  la  sección  anterior.  Empezamos  tomando  un  número  natural 
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Figura  8.4:  Representación  gráfica  de  la  solución  numérica  de  la  ecuación  de  Laplace  del  ejemplo. 


m  >  0  y  definiendo  h  =  ^ .  Luego  elegimos  un  tamaño  de  paso  k  para  la  variable  temporal  t.  Los  puntos  de 
malla  en  este  caso  son  ( Xi ,  t:¡ ) ,  donde  =  ih,  para  i  =  0, 1, . . . ,  m  y  tj  =  jk,  para  j  =  0,1,... 

Construimos  el  método  de  diferencias  utilizando  la  fórmula  de  Taylor  en  t  para  generar  la  fórmula  de 
diferencias  progresivas 

utfa, tj)  =  +0(fc); 

y  la  fórmula  de  Taylor  en  x  para  generar  la  fórmula  de  diferencias  centradas 

/  ,  \  'U'ipCi—  lü^y)  2 VJ(Xi,tj') 

r  vJyil  ). 

Sustituyendo  estas  ecuaciones  en  la  EDP,  denotando  las  aproximaciones  de  los  valores  u(xi,tj)  por  Ui¿  y 
despreciando  los  términos  de  error  0(k )  y  0(h2):  obtenemos  la  correspondiente  ecuación  en  diferencias 

Ibj  +  1  H i,j  q  Ib— l,j  2z¿¿^  “t”  Ib+l,j 

k  h?  ■ 

Por  comodidad,  tomamos  A  =  en  la  ecuación  en  diferencias  anterior  y  reordenamos  los  términos  para 
obtener  la  ecuación  en  diferencias  progresiva 

Ib,j+1  —  (1  2A)'U7;?-  -p  A  (ui—ij  -p  ,  Z  —  1,2,...,  77T  1,  J  —  0,  1,  .  .  . 


En  forma  esquemática,  la  ecuación  anterior  puede  verse  en  la  figura  8.5  La  solución  en  cada  punto  ( i,j  +  1) 
del  nivel  ( j  +  l)-ésimo  de  tiempo  se  puede  expresar  en  términos  de  los  valores  de  la  solución  en  los  puntos 
(i  —  1  ,j),  ( i,j )  y  (i  +  1  ,j)  del  nivel  anterior  de  tiempo.  Fijando  un  instante  final  T,  elegimos  un  número  de 
subintervalos  temporales  n  y  con  la  expresión  anterior  vamos  calculando  la  solución  en  cada  instante  hasta 
llegar  a  T.  Este  procedimiento  se  conoce  como  método  de  diferencias  finitas  progresivas  o  método 
explícito  clásico,  es  un  método  explícito  (ya  que  todas  las  aproximaciones  pueden  hallarse  directamente  a 
partir  de  la  información  dada  por  las  condiciones  iniciales  y  las  de  contorno)  y  de  orden  0(k  +  h2). 

Los  valores  de  la  condición  inicial  u(x¿,  0)  =  /(x¿),  para  i  =  0,1,...,  m,  se  utilizan  en  la  ecuación  en 
diferencias  para  hallar  los  valores  de  u^i,  para  i  =  1,2,  ...,m—  1.  Las  condiciones  de  contorno  u(0,t)  = 
u(£,t)  =  0,  implican  que  z¿o,i  =  wm,i  =  0,  así  que  podemos  determinar  todas  las  aproximaciones  de  la  forma 
Uiy.  Aplicando  el  mismo  procedimiento,  una  vez  que  se  conocen  todas  las  aproximaciones  podemos 
calcular  los  valores  Uit2,  ib, 3,  •  ■  • ,  ib,m-i  de  forma  parecida. 

La  naturaleza  explícita  del  método  implica  que  la  matriz  (to  —  1)  x  (m  —  1)  asociada  es  tridiagonal: 


/  1-2A  A 
A  1 -2A 
A 


\ 


A 

1 -2A  A 


A  1 -2A  A 

A  1-2A  ) 
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/(O,  í)  =  o 


(if  j+1) 

(i-lf j) 

(1/  j) 

(i+lf j) 

w(+0)  =  f(x) 


u(£,  t)  =  0 


Figura  8.5:  Forma  esquemática  para  el  método  explícito  clásico  (ecuación  del  calor). 


Si  definimos  u(0)  =  (f{x1)J(x2),  ■■■,  /(*m-i))T  y 

u0)  =  (ui  ■  ■  ■ ,  para  cada  j  =  1,2,... 

entonces  la  solución  aproximada  viene  dada  por 

para  cada  j  =  1,2,... 

de  manera  que  se  obtiene  a  partir  de  u^-1^  mediante  una  simple  multiplicación  matricial 


Comentario  ADICIONAL.  >  El  método  explícito  anterior  no  necesariamente  produce  buenos  resultados. 
Puede  verse  en  m  que  el  método  no  refleja  la  exactitud  esperada  de  orden  0{k  +  h2)  para  un  problema 
concreto.  Esto  se  debe  a  la  condición  de  estabilidad  del  método  explícito.  Hay  que  hacer  elecciones 
apropiadas  para  los  tamaños  de  paso  h  y  k  que  determinan  los  valores  de  A.  Se  puede  demostrar,  véase 
m,  que  el  método  explícito  es  estable  si  A  es  tal  que  0  <  A  <  Esto  significa  que  el  tamaño  de 

i  2 

paso  k  debe  cumplir  que  k  <  de  manera  que  si  esto  no  se  cumple,  puede  ocurrir  que  los  errores 
introducidos  en  una  fila  j,  se  incrementen  en  alguna  fila  posterior  para  algún  r  >  j. 

Para  obtener  un  método  más  estable,  consideraremos  un  método  implícito.  La  ecuación  en  diferencias 
finitas  de  este  método  se  obtiene  al  discretizar  la  EDP  en  dos  instantes  y  hacer  la  media.  Así,  si  en  la  EDP 
reemplazamos  ut(x,t)  por  una  diferencia  progresiva  y  uxx{x,t)  por  el  valor  medio  de  una  diferencia  centrada 
en  los  pasos  de  tiempo  j  y  j  +  1,  da 


UJÍ,j- (-1 

k 


2  h? 


Ui-i,j+i  —  2uíj+i  +  Wi+ij+i 

h? 


que  tiene  un  error  de  orden  0(k 2  +  h2).  Tomando  de  nuevo  A  =  4$,  la  ecuación  en  diferencias  anterior  se 
puede  escribir  ahora  como 


— Att¿_ij-|-i  +  2(1  +  \)ui¿+i  —  A-Uj+ij+i  —  Xuí-ij  +  2(1  —  A)it¿j  +  Ait¿_|_ij, 

para  i  =  1,2, . . .  ,m  —  1  y  j  =  0,1,...  Este  procedimiento  se  llama  método  de  Crank-Nicolson  y  es 
incondicionalmente  estable.  Su  forma  esquemática  puede  verse  en  la  figura  [876] 

La  forma  matricial  del  método  de  Crank-Nicolson  es 


donde 


Au(]+l)  =  nWJ\  j  =  0,1,2,... 

(Ri,_7  )  R25i7  j  •  •  *  )  Rm— l,j)  j 

(  2(1  +  A)  — A 

-A  2(1  + A)  -A 

-A  2(1  + A)  -A 

A=  ' 


-A  2(1  + A) 
-A 


\ 


-A 

2(1  +  A)  / 


V 
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«0,0)  =  /O) 


Figura  8.6:  Forma  esquemática  para  el  método  de  Crank-Nicolson  (ecuación  del  calor). 


2(1  -  A)  A 

A  2(1  -  A)  A 

A  2(1- A)  A 


A  2(1- A)  A 

V  A  2(1  -  A)  / 

Obsérvese  que  el  término  del  miembro  derecho  de  la  ecuación  matrical  anterior  es  conocido,  así  que  esta 
ecuación  es  un  sistema  lineal  tridiagonal.  La  matriz  tridiagonal  A  es  definida  positiva  y  diagonal  estrictamente 
dominante,  así  que  es  no  singular  y  el  sistema  de  ecuaciones  se  puede  entonces  resolver  mediante  cualquier 
método  descrito  en  el  capítulo  1. 

Ejemplo.  Consideramos  la  ecuación  del  calor 

ut  =  uxx  =  0,  0  <  x  <  1,  t  >  0, 

Íu(0,t)  =  u(l,t)  =  0,  t>  0,  (condiciones  de  contorno), 
it(a:,0)  =  sen nx,  0  <  x  <  1,  (condición  inicial). 

Vamos  a  tomar  h  =  0.2  y  k  =  0.05,  de  manera  que  A  =  1.25  y  m  =  5.  Reemplazando  el  valor  de  A  en  la 
ecuación  en  diferencias,  obtenemos 

—  1.25u¿_ij+i  +  4.5w¿  j+i  —  1.25ttj_(_i  j+i  =  1.25w¿_i,j  —  0.5  Ui¿  +  1.25ui+itj,  i  =  1,2, 3, 4. 

En  el  primer  paso  de  tiempo  t  =  k,  Ui  i  está  dado  por  la  solución  del  sistema  tridiagonal 


4.5  -1.25 


-1.25 


4.5  -1.25 


0  -1.25 


4.5  -1.25 


0  -1.25 


— O-Srii  Q  1.25í¿2,o 

1.25141,0  —  0.5«2,o  +  1.25t43,o 
1.25i¿2,o  —  0.5ií3,o  +  1.25«.4,o 
1.25ií3,o  —  0.5tí4,o 
0.894928  \ 

1.448024 

1.448024 

0.894928 


donde  'u¿,o  =  sen(mh).  La  solución  del  sistema  tridiagonal  es 

u(x¿,0.05)  =  (0.36122840, 0.58447983, 0.58447983,  0.36122840)t 


i  =  1,2, 3, 4. 
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La  solución  aproximada  en  t  =  0.5,  después  de  10  pasos  de  tiempo,  puede  encontrarse  en  m-  La  figura  |8.7| 
muestra  la  aproximación  numérica  de  la  solución.  □ 


x  i 


Figura  8.7:  Representación  gráfica  de  la  solución  numérica  de  la  ecuación  del  calor  del  ejemplo. 


8.4.  Métodos  de  diferencias  finitas  para  ecuaciones  hiperbólicas 

Como  ejemplo  de  una  EDP  hiperbólica,  consideramos  la  ecuación  de  ondas 

Utt  O:  Uxxi  0<Cx<^£,  í  >0, 


sujeta  a  las  condiciones 

u(0,  t)  =  u(¿,  t)  =  0,  t  >  0,  (condiciones  de  contorno), 

u(a:,0)  =  f{x),  ut(x,  0)  =  g{x),  0  <  x  <  £,  (condiciones  iniciales) . 


Tomamos  un  número  natural  m  >  0  y  un  tamaño  de  paso  para  la  variable  temporal  k  >  0.  Con  h  =  los 
puntos  de  malla  (x¿,  tj)  están  dados  por  Xi  =  ih  y  tj  =  jk,  para  cada  i  =  0, 1, . . . ,  m  y  j  =  0, 1, . . .  El  método 
de  diferencias  finitas  se  obtiene  utilizando  las  fórmulas  de  diferencias  centradas  para  las  derivadas  parciales 
segundas  dadas  por 


Htt{Xi,  tj ) 


u{xi,tj-\)  -  2 u(xi,tj)  +  u(xi,tj+ 1) 

P 


0(k2), 


Sustituyendo  estas  fórmulas  en  la  ecuación  de  ondas,  denotando  las  aproximaciones  de  los  valores  u(x.i,tj) 
por  u,jtj y  despreciando  los  términos  de  error  0(k2)  y  0(h 2),  obtenemos  la  ecuación  en  diferencias  de  orden 
0(k2  +  h 2) 

Uij—i  ‘2'Uij  T  UiJ- (-1  2  1  ,j  2u7;.y  T  Ui- {-l,j 


k2 


h 2 


Tomando  A  =  ak/h:  podemos  despejar  la  aproximación  más  avanzada  en  el  tiempo,  para  obtener  la 

fórmula  explícita 


+ 1  —  ^(1  A  )Ujj  A  ( Ui—lJ  Ui-\-\  j  )  U,; ,  j  —  i ,  í  2, . . . ,  m  1 ,  j  1,2,... 


Esta  fórmula  se  muestra  de  forma  esquemática  en  la  figura  8.8  La  solución  en  cada  punto  (i,j  +  1)  del  nivel 
(j  +  l)-ésimo  de  tiempo  está  expresada  en  términos  de  los  valores  solución  en  los  puntos  (*  —  1  ,j),  ( i,j ), 
(i  +  l,j)  y  (i,  j  —  1)  de  los  dos  niveles  de  tiempo  precedentes.  Dicha  fórmula  tiene  problemas  de  estabilidad 
y  se  puede  demostrar,  véase  m ,  que  el  método  es  estable  si  0  <  A  <  1. 

Observemos  que  la  expresión  anterior  nos  permite  obtener  la  solucionen  el  instante  tj+ 1  a  partir  de  la 
solución  en  los  instantes  tj  y  tj- 1.  Es  decir,  para  calcular  la  entrada  w¿j+i  en  el  nivel  de  tiempo  (j  +  1), 
debemos  conocer  las  entradas  de  los  niveles  de  tiempo  j  y  (j  —  1).  Esto  supone  un  pequeño  problema  de 
partida  porque  solo  conocemos  la  primera  fila  de  la  condición  inicial  o  =  f(xi).  Para  obtener  la  segunda 
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u(0,  t)  =  0 


_ é 

(i>  j  +  1) 

fe _ 

_ i 

(Í  — U  j) 

fe  4 

9 

(i/  j) 

fe  4 

< *  < -  j) 

9  1 

_ 4 

9  1 

(i, j-1) 

fe _ 

P 

9 

=0 


u(x,  0)  =  f(x),  ut(x,0)  =  g(x) 

Figura  8.8:  Forma  esquemática  para  el  método  de  diferencias  finitas  con  tres  niveles  (ecuación  de  ondas). 


fila  corresponiente  a  rt¿.i ,  hay  que  utilizar  la  segunda  condición  inicial  iq(x,0)  =  g(x).  Una  posibilidad  es 
sustituir  ut  por  una  aproximación  en  diferencias  progresivas 


ut(xi,  0) 


u(xj,t i)  -u(xj,0)  + 


que  nos  permite  obtener  una  ecuación  en  diferencias  finitas  que  da  una  aproximación  para  la  segunda  fila  con 
un  error  de  truncamiento  de  solo  O(k).  Para  obtener  una  mejor  aproximación,  consideramos  el  desarrollo  en 
serie  de  Taylor  de  u(x,t)  alrededor  del  punto  (ay,  0) 


u{xi,t\)  =  u(xí,  k)  =  u(xí,  0)  +  kut(xi,  0)  +  —utt(xi,  0)  +  0(k3). 
Suponiendo  que  la  derivada  segunda  de  f(x)  existe,  tenemos 

'Utt(x¿i  0)  a  uxx (.Xi *  0)  ol  f  (x¿), 


de  manera  que,  utilizando  las  condiciones  iniciales  ut(x¿,  0)  =  g(x¿)  y  u(x¿ ,  0)  =  f(x¡),  se  sigue  que 

u(xi,h)  =  f(xi)  +  kg(xi)  +  ya2/"(i,)  +  0(k3). 

Si  no  es  posible  calcular  f"{xi )  directamente,  podemos  reemplazar  /"(x¿)  en  la  última  ecuación  por  una 
fórmula  de  diferencias  centradas 

/>,)  ■  /(».-!)-  2/fe) +  /UH-0  +  0{h2} 

En  este  caso,  la  aproximación  numérica  en  la  segunda  fila  está  dada  por  la  fórmula 

k2a 2 

«»,  i  =  f(xi)  +  kg(xi)  +  -^-(f(xi-i)-2f(xi)  +  f(xi+i)) 

A2 

=  (1  ~  A2)/(x¿)  +  y(/0r¿-i)  +  f(xi+i))  +  kg(xi),  i  =  1,2, . . .  ,m  -  1, 

que  tiene  una  exactitud  de  orden  0{k3  +  h2k2). 

Ejemplo.  Sea  la  ecuación  de  ondas 


llt.t  lfil/xx?  0  <  X  <  1,  t  0, 

sujeta  a  las  condiciones 

u(0,t)  =  u(l,t)  =  0,  t  >  0,  (condiciones  de  contorno), 

u(x,  0)  =  sen  7rx,  ut(x,  0)  =  0,  0  <  x  <  1,  (condiciones  iniciales). 
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Tomamos  h  =  0.2  y  k  =  0.05,  de  manera  que  A  =  1  y  m  =  5.  Las  aproximaciones  de  u  en  t  =  0.05,  para 
i  =  1,  2,  3,4,  son  como  se  sigue  a  continuación.  Las  condiciones  de  contorno  dan 

«o,j  «5  j  =  0,  j  =  1,2,... 

y  las  condiciones  iniciales  dan 

Uito  =  sen(0.27rz),  i  =  0,1,2, 3,4,5, 

«¿,i  =  i(/(0.2(i-l))  +  /(0.2(i  +  l)))  +  (0.05)fl(0.2¿) 

=  0.5[sen(0.27r(z  —  1))  +  sen(0.27r(¿  +  1))],  i  =  1,2, 3, 4. 


Luego, 


«M  =  0.47552826,  u2, 1  =  0.76942088,  u3,i  =  0.76942088,  u4,i  =  0.47552826. 


Para  t  =  2k  =  0.1,  obtenemos  la  ecuación  en  diferencias 


«¿,2  —  IR— 1,1  T  «z+ 1,1  o,  i  R  2,  3, 4, 


que  implica  que, 

«i, 2  =  M2,i  —  Mi,o  =  0.18163563, 

z¿2,2  =  ui,i  T  1/3,1  —  «2,0  =  0.29389263, 

«3,2  =  112,1  4“  «4,1  —  «3,0  1  0.29389263, 


«4,2  =  «3,1  —  «4,0  =  0.18163563. 


La  solución  aproximada  en  í  =  0.5,  después  de  10  pasos  de  tiempo,  junto  con  una  representación  en  tres 
dimensiones,  se  puede  encontrar  en  m-  La  figura [811] muestra  la  aproximación  numérica  de  la  solución.  □ 


X 


1 


1 

0.5 

0 

-0.5 

-1 


Figura  8.9:  Representación  gráfica  de  la  solución  numérica  de  la  ecuación  de  ondas  del  ejemplo. 


8.5.  Introducción  al  método  de  los  elementos  finitos 

En  las  secciones  anteriores  se  han  descrito  métodos  de  diferencias  finitas  para  resolver  problemas  de 
contorno  con  EDP.  Para  estos  métodos  los  puntos  de  la  malla  se  suelen  colocar  uniformemente  espaciados 
dentro  de  la  región.  Si  los  puntos  no  están  exactamente  en  las  fronteras,  se  requieren  ajustes  especiales  para 
los  puntos  adyacentes  a  la  frontera  y  los  errores  son  mayores  cuando  se  hace  esto. 

En  esta  sección  vamos  a  introducir  un  método  diferente  especialmente  valioso  para  regiones  irregulares:  el 
método  de  los  elementos  finitos  (abreviadamente,  MEF).  En  este  método  los  puntos  pueden  estar  espaciados 
de  manera  no  uniforme.  Esto  no  solo  resuelve  el  problema  de  hacer  coincidir  los  puntos  con  una  frontera,  sino 
que  también  facilita  la  colocación  más  estrecha  de  los  puntos  entre  sí  en  partes  de  la  región  donde  la  solución 
del  problema  varía  rápidamente,  con  lo  que  se  mejora  la  exactitud.  Hoy  día  matemáticos  e  ingenieros  utilizan 
ampliamente  el  MEF. 
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Introducimos  a  continuación  el  MEF  para  EDP  elípticas.  La  EDP  elíptica  que  vamos  a  resolver  en  esta 
sección  es  la  ecuación  bidimensional  de  Laplace, 

UXx  ILyy  —  0, 


con  ( x ,  y)  £  S ,  donde  S  es  una  región  plana. 

Un  ejemplo  típico  es  la  determinación  de  la  distribución  del  potencial  eléctrico  u(x,  y)  en  el  espacio 
entre  dos  conductores  rectangulares.  Dada  la  simetría  del  problema,  solo  una  cuarta  parte  de  la  región  real 
del  problema  necesita  analizarse.  En  este  caso,  surgen  dos  clases  de  condiciones  en  la  frontera  (véase  la 
figura  [sTTol :  valores  de  potencial  constante  a  lo  largo  de  las  superficies  conductoras  (llamadas  condiciones  de 
Dirichlet )  y  valores  nulos  de  derivadas  normales  a  lo  largo  de  los  planos  de  simetría.  Es  decir,  se  tienen  las 
condiciones  en  los  conductores 


u(x,y) 


0  en  el  conductor  interior, 
1  en  el  conductor  exterior, 


y  en  las  superficies  normales  a  los  circuitos 


conductor  exterior  u{x,y)  =  1 


Figura  8.10:  Región  plana  S  con  condiciones  de  contorno. 


El  principio  de  la  energía  de  potencial  mínima  dice  que  u(x,  y)  es  solución  si  y  solo  si  minimiza  la  función 
energía: 

' du\ 2  ( du ' 

. dx J  +  \dyy 


m 


dxdy , 


donde  S  es  la  región  plana  de  la  figura  [8dÜJ 

El  MEF  minimiza  la  función  energía  I[u\  asociada  al  potencial  u(x,  y)  suponiendo  que  el  pontencial  u(x,  y) 
está  dado  por  una  combinación  lineal  de  funciones  elementales  (usualmente  polinomios  de  grado  fijo  en  las 
variables  x  e  y)  con  coeficientes  a  determinar  y  definidas  a  trozos  sobre  una  partición  de  S  que  consideremos. 

En  nuestro  caso,  utilizaremos  los  denominados  elementos  triangulares  de  primer  orden.  Para  ello,  dividi¬ 
mos  la  región  S  en  triángulos  X¿  como  en  la  figura  8.11|  (cuantos  más  triángulos,  mejor  será  la  aproximación) 
y  denotamos  los  vértices  por 
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Figura  8.11:  Región  plana  S  dividida  en  triángulos. 


El  MEF  busca  una  aproximación  de  la  forma 

8 

U(x,y)  =  ^7 iUi(x,y), 

¿= i 

donde  7 ¿  son  constantes,  el  número  de  sumandos  coincide  con  el  número  de  vértices  Ei  y  Ui(x,y)  es  tal  que 

1.  sobre  cada  triángulo  T¿,  son  polinomios  lineales  en  x  e  y  de  la  forma  a  +  bx  +  cy,  donde  a,  b 
y  c  son  constantes  distintas  por  lo  general  para  cada  triángulo, 

2.  Uí(Eí)  =  1, 

3.  Ui(Ej)  =  0  para  j  ^  i. 

Si  imponemos  las  condiciones  en  la  frontera,  que  conocemos  para  la  solución  u(x,  y),  para  la  aproximación 
U(x,y),  se  tiene  que 

U(E2)  =  U(E3)  =  U(Ei)  -  U(E5)  =  1  y  U(E6)  =  U(E?)  =  U(E8)  =  0. 

Entonces,  como  Ui(Ek)  =  0  si  k  yf  i  y  u^Ej)  =  1,  se  sigue  que 

72  =  73  =  74  =  75  =  1  y  76  =  77  =  78  =  0, 

por  lo  que 

5 

U(x,y)  =  71  ui(x,y)  +  '^2ui(x,y). 

i— 2 

A  continuación,  se  calculan  las  funciones  u,.  Calculamos  como  ejemplo  la  función  u-¡ .  Sobre  cada  triángulo 
Ti  la  función  ui  es  de  la  forma 


ui(x,y)  =  a¿  +  btx+  Ciy,  para  (x,y)  G 

Hay  dos  clases  de  triángulos:  los  que  contienen  a  E\ ,  que  son  T\  y  T2,  y  los  que  no  lo  contienen,  que  son  el 
resto. 
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En  Ti  los  vértices  son  Ei  =  (0,  2.5),  Ee  =  (0, 2)  y  E7  =  (2,  2).  Así, 

r¿i(E/^)  —  o>i  &i  0  C\  2.5  =  1, 

ui(Eq)  =  ai  +  &i  0  +  C\  2  =  0, 

ui(E'f')  =  ai  — 2  — Cx  2  =  0, 

cuya  solución  es 


ai  =  —4, 


b  i  =  0, 


ci  =  2. 


Luego, 

ui{x,y)  =  -4  +  2y,  para  (x,  y)  €  Ti. 

En  T2  los  vértices  son  Ed  =  (0,  2.5),  U2  =  (0, 3)  y  E3  =  (2,  3),  de  manera  que 

ui(Ei)  =  a2  +  620  +  c22.5  =  1, 

u\(E2)  =  a2  +  b20  +  c23  =  0, 

ui(E3)  =  a2  +  b22  +  c23  =  0. 

La  solución  es 

a2  =  6,  b2  =  0,  c2  =  -2, 

por  lo  que 

ui(x,y)  =  6  -  2y,  para  (x,  y)  G  T2. 

En  los  triángulos  que  no  contienen  a  E\  los  correspondientes  sistemas  de  ecuaciones  que  resultan  son 
homogéneos  (todos  los  términos  independientes  son  0)  y  libres,  de  forma  que  la  solución  es 


a¿  0,  bi  —  0, 


Ci  =  0 


y,  en  consecuencia, 

ui(x,y)  =  0,  para  ( x,y )  G  T  y  Ex  (£  T¿. 

Resumiendo, 

f  -4  +  2 y  para  ( x ,  y)  G  Ti 

ui(x,y)  =  <  6  -  2y  para  (x,  y)  G  T2  (8.1) 

[o  para  (x,y)  G  y  i  ^  1,2. 

Se  deja  como  ejercicio  para  los  estudiantes  el  cálculo  de  los  restantes  . 

Una  vez  encontrados  todos  los  u¿  solo  quedan  por  determinar  los  coeficientes  que  no  se  pudieron 
encontrar  al  imponer  las  condiciones  de  contorno.  En  nuestro  caso,  únicamente  71.  Para  ello,  imponemos  que 
se  minimice  la  función  energía 


dxdy 


+E 


2 


+  E 


21 


dxdy. 


Para  encontrar  el  mínimo  de  I[U )  es  necesario  resolver 


di 


=  0. 


Al  derivar,  obtenemos 


di 

<971 


du-\  (  du\  sr-  dui\  du\  (  du-\  AA  <9u¿ 
dx  y  f  l  dx  +  dx  J  +  dy  y^1  dy  ^ 


i= 2 


dy 


7i 


dui  du\ 
dx  dx 


wtrE-g  SSs 


dui  dui 
dx  dx 


dxdy 

dui  dui 
h  dy  dy 


dxdy , 
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e  igualando  a  cero,  vemos  que 


7i  = 


Zí=2  ffs( 


duj  du\ 
dx  dx 


duj  du 
dy  dy 


f)  dxdy 


lls(^^  +  ^w)dxdy 


Es  necesario  entonces  el  cálculo  de  la  suma  de  cuatro  integrales  y  la  integral  del  denominador. 

Como  ejemplo  calculamos  la  integral  del  denominador.  Para  las  integrales  del  numerador  se  procede  de 
igual  forma,  necesitando  para  ello  el  cálculo  de  los  tt¿  con  i  >  2. 

Como  la  región  S  se  encuentra  dividida  en  triángulos,  obtenemos  que 

'  dui  du\  dui  dui  \  /'  /'  ( du±  du±  du\  du1  \ 

+  dxdy  =  )-.J  JT í w  a¿+  s 


Í=  1 
2 

=  £ 


dui  dui  dui  dui 
dx  dx  dy  dy 


dxdy , 


donde  la  segunda  igualdad  se  sigue  de  que  la  función  u\  es  nula  sobre  los  triángulos  73,74,  T5  y  Tq  (véase 

©). 


De  nuevo  por  (8.1 1  en  el  triángulo  Tj  se  tiene  que 

du  1 


dx 


=  0, 


y  en  el  triángulo  T2 


dx 


dui 

dy 

dui 

dy 


=  2, 


=  -2. 


Por  tanto,  la  integral  queda 

í  í  (0  +  2.2 )dxdy  +  í  í  (0  +  (— 2)(— 2)dxdy  =  4  í  í  dxdy  +  4  í  í  dxdy. 

1/  J  Ti  w  J  T2  «  1/  w  «/  T2 

Obsérvese  que  las  dos  últimas  integrales  son  las  áreas  de  Ti  y  T2  respectivamente,  que  son  igual  a  1/2  (véase 
la  figura  8.11 1.  En  consecuencia, 


f  f  ( dui  dui  ,  dux  dux  \  _ 

J  Js  V.  dx  dx  dy  dy  )  X  V 


Terminamos  dejando  para  los  estudiantes  dos  ejercicios.  El  primero,  el  cálculo  de  las  integrales 

f  f  ( dui  dm  dmdu  1  \  . 

/  /  )  dxdV’  *  =  2,3, 4, 5. 

J  Js  V  &x  dy  ) 

Y  el  segundo,  el  cálculo  del  valor  71  que  minimiza  la  función  energía  y  la  solución  aproximada  U(x:y). 


8.6.  Sugerencias  para  seguir  leyendo 

El  tratamiento  numérico  dado  en  este  capítulo  a  la  resolución  de  EDP  es  solo  una  muy  breve  introducción 
a  un  área  muy  extensa  de  investigaciones  y  aplicaciones.  A  continuación  ofrecemos  solo  algunos  de  los  textos 
que  proporcionan  una  fuente  excelente  para  un  estudio  posterior  de  estos  tópicos:  Golub  y  Ortega  (1992), 
Larsson  y  Thomée  (2003),  Grossmann  y  otros  (2007)  y  Gockenbach  (2011)  y  Davis  (2011). 


8.7.  Ejercicios 


1.  Determínese  el  sistema  de  cuatro  ecuaciones  con  cuatro  incógnitas  v±,  v2,  y  rq  que  se  usa  para 
calcular  las  aproximaciones  a  la  solucón  de  la  ecuación  bidimensional  de  Laplace  en  el  cuadrado  D  = 
{(x,y)/  0  <  x  <  3,  0  <  y  <  3}.  Los  valores  en  la  frontera  son 

u(x,  0)  =  10,  u(x,3)  =  90,  0  <  x  <  3, 

u(0,  y)  =  70,  u( 3,  y)  =  0,  0  <  y  <  3. 


8.7.  EJERCICIOS 


107 


2.  Calcúlense  las  tres  primeras  filas  de  la  malla  que  se  construye  para  la  ecuación  de  Poisson 

uxx  +  uyy  =  6x,  0  <  a:  <  1,  0  <  y  <  1, 

u(x,  0)  =  x3,  u(x,  1)  =  x3  —  3x  +  1,  0  <  x  <  1, 

u(0,y)=y,  u{l,y)  =  -2y  +  1,  0  <  y  <  1, 

utilizando  una  malla  con  h  =  k  =  0.1.  Realícense  las  operaciones  a  mano  (o  con  calculadora). 

3.  Utilícese  el  método  explícito  clásico  para  calcular  las  tres  primeras  filas  de  la  malla  que  se  construye 
para  la  siguiente  ecuación  del  calor 

Ut  —  'Uxxi  0  1,  ¿A  0, 

u(0,  t)  =  u(l,  t)  =  0,  t  >  0, 
u(x,  0)  =  sen  irx,  0  <  x  <  1. 

Tómese  h  =  0.1  y  k  =  0.01.  Realícense  las  operaciones  a  mano  (o  con  calculadora). 

4.  Obsérvese  en  el  método  explícito  clásico  para  la  ecuación  del  calor  que  si  la  elección  de  h  =  k  =  \  da 
un  valor  de  A  mayor  que  tendríamos  que  aumentar  h  o  disminuir  k.  Además,  si  elegiésemos  A  =  A 
y  luego  hiciésemos  una  elección  conveniente  de  k,  podría  obtenerse  una  elección  irracional  de  h  que  no 
produjese  un  número  entero  de  subintervalos.  Entonces,  si  (3  =  3,  £  =  4.2  y  se  obtiene  A  =  ¿cuáles 
deberían  ser  las  elecciones  de  h  y  k  si  queremos  aproximar  u(x,  3)? 

5.  Sea  k  = 

a)  Utilícese  la  igualdad  anterior  en  la  fórmula  de  la  ecuación  en  diferencias  del  método  de  Crank- 
Nicolson  y  simplifíquese  la  ecuación  resultante. 

b )  Exprésense  las  ecuaciones  del  apartado  anterior  matricialmente. 

c)  ¿Es  la  matriz  correspondiente  al  apartado  anterior  diagonal  estrictamente  dominante? 

6.  Sea  la  ecuación  parabólica  ut  —  uxx  =  h(x ). 

a)  Desarróllese  el  método  de  diferencias  finitas  progresivas  para  la  ecuación  anterior. 

b)  Desarróllese  el  método  implícito  clásico  para  la  ecuación  anterior. 

c)  Desarróllese  el  método  de  Crank-Nicolson  para  la  ecuación  anterior. 

7.  Si  en  la  ecuación  del  calor  reemplazamos  ut(x,t)  por  una  diferencia  regresiva  y  uxx(x,t)  por  una 
diferencia  centrada  en  el  j-ésimo  paso  de  tiempo,  obtenemos  el  método  implícito  clásico  para  la  ecuación 
del  calor.  Demuéstrese  que  dicho  método  está  dado  por 

Ui  j—\  —  A T  (1  4~  2A)r¿¿)j  Ar¿¿_|_i_j ,  i  —  1,2,...,  tti  1,  j  —  1,2,..., 

donde  A  =  (Este  método  es  estable  y  el  error  es  de  orden  0{k  +  h 2).) 

8.  Utilícese  el  método  implícito  clásico  obtenido  en  el  ejercicio  anterior  para  aproximar  la  solución  del 
problema 

Ut  —  jg  uxx¿  O^x^l,  t  0, 

íí(0,  t )  =  u(  1,  t)  =  0,  t  >  0, 

ií(a:,0)  =  2sen(27rcc),  0  <  x  <  1, 

con  m  =  3  y  k  =  0.01.  Calcúlense  las  tres  primeras  filas  de  la  malla  y  compárense  los  resultados  con  la 
solución  exacta  u,(x,t)  =  2e-(í)  *8611(2^2;). 

9.  Desarróllese  un  método  de  diferencias  finitas  para  resolver  la  EDP  parabólica  no  lineal  uxx  =  uut ■ 
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10.  La  ecuación  del  calor  en  dos  dimensiones  espaciales  es  ut  =  /3(uxx  +  uyy),  que  modela  la  distribución  de 
temperatura  sobre  la  superficie  de  una  placa  calentada.  Sin  embargo,  más  que  caracterizar  la  distribución 
en  un  estado  estacionario,  como  se  hace  para  la  ecuación  de  Laplace,  esta  ecuación  ofrece  un  medio 
para  calentar  la  distribución  de  temperatura  de  la  placa  conforme  cambia  con  el  tiempo.  Obténgase 
una  solución  explícita  sustituyendo  en  la  EDP  las  aproximaciones  por  diferencias  finitas,  tal  y  como  se 
hace  para  la  ecuación  del  calor  en  una  dimensión  espacial.  Demuéstrese  que  son  necesarios  cinco  puntos 
en  un  instante  anterior  para  calcular  cada  nuevo  valor  de  Uij. 

11.  Condiciones  aisladas  para  la  ecuación  del  calor.  La  forma  de  las  condiciones  de  contorno  depende  del 
hecho  físico  que  se  describa.  Por  ejemplo,  si  se  mantiene  aislado  un  extremo  de  la  varilla  en  la  ecuación 
del  calor,  entonces  la  derivada  parcial  ux  es  cero  en  ese  extremo;  es  decir,  ux(0,t)  =  0  o  ux(£,t)  =  0. 
Desarróllese  el  método  explícito  para  la  ecuación  del  calor  cuando  la  temperatura  está  dada  en  un 
extremo  (x  =  0),  mientras  que  el  otro  extremo  ( x  =  £)  está  aislado.  (Se  recomienda,  para  la  condición 
de  contorno  que  se  dé  en  la  derivada,  añadir  un  punto  ficticio  a  la  malla;  habitualmente  se  extiende  la 
malla  para  incluir  un  punto  en  cada  paso  de  tiempo.) 

12.  Utilícese  el  método  de  diferencias  finitas  para  calcular  las  tres  primeras  filas  de  la  solución  aproximada 
de  la  siguiente  ecuación  de  ondas 

Utt  —  4  Hxx;  0  <  X  <  1,  t  >  0, 
u(0,t)  =  u(l,t )  =  0,  t  >  0, 

52x  ,  para  0  <  x  <  |, 

^(1  —  x),  para  |  <  x  <  1, 

[  ut(x,  0)  =  0,  0  <  x  <  1. 

Tómese  h  =  0.2  y  k  =  0.1.  Realícense  las  operaciones  a  mano  (o  con  calculadora). 

13.  En  la  ecuación  utt  =  9uxx,  ¿qué  relación  debe  existir  entre  h  y  k  para  que  la  ecuación  en  diferencias 
que  se  obtenga  esté  dada  por  Ui,j+i  —  ui-i,j  +  ui+i,j  ~  ui,j- 1? 

14.  ¿Qué  dificultad  puede  aparecer  cuando  se  intenta  utilizar  el  método  de  diferencias  finitas  para  resolver 
Utt  =  4  uxx  tomando  h  =  0.03  y  k  =  0.02?  ¿Cómo  se  podría  solventar  dicha  dificultad?  Propóngase  y 
llévese  a  cabo  una  solución  para  solventar  dicha  dificultad. 

15.  Método  implícito  para  la  ecuación  de  ondas.  Para  la  ecuación  de  ondas,  como  en  el  caso  de  la  ecuación 
del  calor,  los  métodos  implícitos  tienen  ventajas  de  estabilidad.  Un  esquema  implícito  simple  resulta  de 
reemplazar  utt  por  una  fórmula  de  diferencias  centradas  en  el  í-ésimo  paso  de  espacio  y  uxx  por  el  valor 
medio  de  una  diferencia  centrada  en  los  (j  —  l)-ésimo  y  (j  +  l)-ésimo  pasos  de  tiempo.  Desarróllese 
dicho  esquema. 

16.  Sea  la  ecuación  de  Poisson 

!UXX  +  uyy  =  f(x,y),  0  <  x  <  1,  0<y<  1, 

u(x ,  0)  =  x,  u(x,  1)  =  1,  0  <  x  <  1, 

u(0,y)  =  y,  u(l,y)  =  l,  0  <  y  <  1, 

Construyase  una  malla  apropiada  y  resuélvase  la  ecuación  mediante  el  MEF. 


f(x,  y)  = 


1,  para  (x,y)  =  (|,  |) , 
0,  en  otro  caso. 


Complementos 


Complemento  A 


Valores  propios  y  vectores  propios 


A.l.  Introducción 

La  ecuación  Av  =  Av,  donde  A  es  una  matriz  cuadrada  de  orden  n,  A  es  un  valor  propio  de  A  y  v  el 
vector  propio  asociado  a  A,  se  puede  interpretar  de  forma  mucho  más  general.  La  multiplicación  Av  es  una 
operación  matemática  que  se  puede  ver  como  la  matriz  A  actuando  sobre  el  operando  v,  de  manera  que  la 
ecuación  anterior  se  puede  generalizar  a  cualquier  operación  matemática  de  la  forma  Lv  =  Av,  donde  L  es 
un  operador  que  puede  representar  la  multiplicación  por  una  matriz,  diferenciación,  integración,  etc.,  v  es  un 
vector  o  una  función  y  A  es  un  escalar.  Por  ejemplo,  si  L  representa  la  derivada  segunda  con  respecto  a  x,  y 
es  una  función  de  a:  y  A  es  una  constante,  la  ecuación  Lv  =  Av  puede  tomar  la  forma  y"(x)  =  A y(x).  Luego 
existe  cierta  conexión  entre  los  problemas  de  valores  propios  que  involucran  EDO  y  problemas  de  valores 
propios  que  involucran  matrices. 

La  ecuación  Lv  =  Av  es  una  forma  general  de  un  problema  de  valores  propios,  donde  A  es  el  valor  propio 
asociado  al  operador  L  y  v  es  el  vector  propio  o  función  propia  asociada  al  valor  propio  A  y  al  operador  L. 

Los  problemas  de  valores  propios  son  un  tipo  especial  de  problemas  de  contorno  con  EDO  que  tienen 
especial  importancia  en  ingeniería.  Por  ejemplo,  aparecen  en  problemas  que  implican  vibraciones,  en  proble¬ 
mas  de  la  mecánica  de  fluidos,  en  problemas  de  elasticidad,  en  problemas  de  dinámica  espacial,  así  como  en 
otros  muchos  problemas.  También  se  utilizan  en  otros  diversos  contextos  de  la  ingeniería  diferentes  del  de 
los  problemas  de  contorno  con  EDO.  Además,  es  importante  destacar  que  los  valores  propios  de  una  matriz 
proporcionan  información  útil  sobre  algunas  propiedades  de  los  cálculos  numéricos  que  involucran  a  la  ma¬ 
triz.  Recordemos  que  la  convergencia  de  los  métodos  iterativos  para  resolver  sistemas  lineales  dependía  de 
los  valores  propios  de  sus  matrices  de  iteración,  y  que  la  velocidad  con  que  estos  métodos  convergen  depende 
de  la  magnitud  de  sus  valores  propios. 

Los  métodos  numéricos  que  aproximan  los  valores  propios  de  una  matriz  no  suelen  calcular  el  polinomio 
característico,  sino  que  actúan  directamente  sobre  la  matriz.  En  muchos  problemas  solo  se  necesita  conocer 
el  valor  propio  dominante  (el  de  mayor  módulo)  y  tal  vez  su  vector  propio  asociado.  Para  tales  problemas  el 
método  más  conocido  que  se  utiliza  es  el  método  de  la  potencia.  Con  ligeras  modificaciones  de  este  método 
también  se  pueden  calcular  el  valor  propio  de  menor  módulo  y  los  valores  propios  intermedios. 


A. 2.  El  método  de  la  potencia 

El  método  de  la  potencia  es  un  método  iterativo  que  aproxima  el  mayor  valor  propio  en  módulo.  El 
vector  propio  asociado  al  valor  propio  se  obtiene  como  parte  del  método.  Frecuentemente,  también  se  emplea 
el  método  de  la  potencia  para  calcular  un  vector  propio  asociado  a  un  valor  propio  ya  calculado  por  otros 
medios. 

Si  A  es  una  matriz  cuadrada  de  orden  n,  para  poder  aplicar  el  método  de  la  potencia,  tiene  que  tener 
n  valores  propios  Ai,  A2, . . . ,  \n  con  un  conjunto  linealmente  independiente  de  vectores  propios  asociados 
{vi,v2,  •  ■  •  ,vn}  y  tales  que 

|  Ai  |  >  |  A2 1  >  |  A3 1  >  •  •  •  >  |A„| . 

Como  los  vectores  vi,  v2, . . .  ,vn  son  linealmente  independientes,  podemos  escribir  un  vector  cualquiera 
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v  ^  0  de  R”  como 


v  =  civi  +  c2v2  H - b  c„vn, 


(A.l) 


donde  c¿  yb  0  son  escalares  para  todo  i  =  1, 2, . . . ,  n.  Sea  w0  =  v.  Multiplicando  (A.l  I  por  A,  obtenemos 

Aw0  =  CiAv!  +  c2Av2 

Cn.  A 


i  i  i  ^2  A2  ^ n 

donde  wx  =  vx  H - —  v2  +  •  •  •  H - — 

ci  Ai  ci  Ai 

vi,v2, . . . ,  vn  vectores  propios.  Si  multiplicamos  ahora  wj  por  A,  tenemos 


■  •  +  cnAvn  =  Aiciw1; 
vn,  puesto  que  Avj  =  AjVj,  para  todo  j  =  1,2 por  ser 


.  c2  A¡ 

Awi  =  Aivi  H - t"~ v 2 

c i  Ai 


cn  A“  (  c2  A5 

—  v-vn  =  Ai  vi  H - “To  v2 

ci  Ai  V  ci  K 


L  n  /xn  \  \ 

—  VT  vn  =  AiW2 

c i  Af 


(A.2) 


con  w2  =  Vi 


C2  A| 
Ci  Af 


v2 


c  A2 

—  — (fvn.  Multiplicando  a  continuación  (|A.2|)  por  A,  da 
c  i  Af 


11  c2  An 

donde  w3  =  V],  H - -^v2 

ci  Af 


,  .  c2  Af 

Aw2  =  Aivi  H - tAv2 

c i  Aj 

Af 


Cn  Af 

—  TVvn  =  A1W3, 
Ci  Af 


— -fvn.  Es  fácil  ver  que  iterando  sucesivamente  llegamos  a 
ci  Af 

c2  A§ 

wk  =  vi  H - -jv2  +  ■ 

C i  Ai 


n  \k 
_  An  ,, 

•  fc  Vn' 


Ci  Af 


(A.3) 


Como  Ai  es  el  mayor  valor  propio  en  módulo,  entonces 


segundo  miembro  de  (A.3l  tiende  a  vi  cuando  k  — >  oo.  Por  lo  tanto,  si  k  — >  oo,  obtenemos 

wk-»vi  y  Awk 


<  1,  para  todo  j  =  2, 3, . . . ,  n,  de  manera  que  el 
ito,  si 

Aivi. 


Cuando  se  implementa  el  método  de  la  potencia,  el  vector  wk  se  normaliza  en  cada  paso  dividiendo  las 
componentes  del  vector  por  el  móldulo  de  la  mayor  componente  (véase  (A.l  l  a  través  de  ( A.3 1 ) .  Esto  hace 
que  la  mayor  componente  del  vector  sea  1.  Como  consecuencia  de  este  escalado,  el  método  de  la  potencia 
conduce  al  valor  propio  y  al  vector  propio  asociado. 

El  método  de  la  potencia  se  aplica  generalmente  como  sigue.  Se  empieza  con  una  estimación  inicial  wo 
de  v.  Normalmente  se  elige  esta  estimación  inicial  como  w0  =  (1,1,...,  1)T,  de  manera  que  la  norma  infinito 
||wo||oo  es  1.  Entonces  se  genera  recursivamente  la  sucesión  {wk},  a  partir  de 


Zk-i  =  Awk_i, 

1 

Wk  =  —  Zk_l, 

dk 

donde  dk  es  la  mayor  componente  en  módulo  de  zk_i.  Si  el  método  converge,  el  valor  final  de  dk  es  el  valor 
propio  buscado  y  el  valor  final  de  wk  es  el  vector  propio  asociado.  Esto  es, 


lím  wk  =  Vi  y 

k — KX> 


lím  dk  =  Ai. 

k — KX> 


El  proceso  iterativo  se  termina  cuando  la  norma  infinito  ||wk  —  wk_1||00  es  menor  que  una  tolerancia  espe¬ 
cificada. 


Ejemplo.  La  matriz 

/  -9  14  4  \ 

A=\  -7  12  4 

V  0  o  1  J 

tiene  valores  propios  Ai  =  5,  A2  =  1  y  A3  =  —2,  así  que  el  método  de  la  potencia  converge.  Comenzamos  con 
wq  =  (1, 1, 1)T.  Aplicando  el  método  de  la  potencia  se  calcula  el  vector  wi  a  partir  de  Awq  y  normalizando: 


/  -9  14  4 

Aw0  =  -7  12  4 

\  0  0  1 


1 

1 

1 
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La  siguiente  iteración  será: 


/  -9  14  4 

A-w!  =  -  7  12  4 

\  0  0  1 


Después  de  diez  iteraciones,  la  sucesión  de  vectores  converge  al  vector  v  =  (1, 1, 1.02  x  10  8)T  y  la  sucesión 
{dk}  de  constantes  converge  a  A  =  5.000000205.  En  [TB]  se  encuentra  una  tabla  que  resume  los  cálculos.  □ 


Notas  sobre  la  convergencia  del  método  de  la  potencia 


Generalmente  el  método  de  la  potencia  converge  muy  lentamente,  a  menos  que  el  vector  inicial  esté 
próximo  al  vector  vi.  Puede  surgir  un  problema  cuando  el  vector  inicial  es  tal  que  el  valor  de  Ci  en 
( A.l  I  es  cero.  Esto  significa  que  v  no  tiene  componentes  en  la  dirección  del  vector  vj.  Teóricamente 
el  método  fallará.  En  la  práctica,  sin  embargo,  el  método  puede  converger  (muy  lentamente)  a  causa 
de  la  acumulación  de  errores  de  redondeo  durante  la  repetida  multiplicación  con  la  matriz  A,  que 
proporcionará  componentes  en  la  dirección  de  vi.  (Por  una  vez  podemos  decir  que  los  errores  de 
redondeo  ayudan.) 


■  En  realidad  no  es  necesario  que  la  matriz  A  tenga  n  valores  propios  distintos  para  que  el  método  de 
la  potencia  converja.  Si  la  matriz  tiene  un  único  valor  propio  dominante  Ai  de  multiplicidad  m  >  1 
y  vi,v2,...,vm  son  vectores  propios  linealmente  independientes  asociados  a  Ai,  el  método  seguirá 
convergiendo  a  Ai. 


■  El  método  de  la  potencia  tiene  la  desventaja  de  que  no  se  sabe  de  antemano  si  la  matriz  tiene  un  único 
valor  propio  dominante,  en  cuyo  caso  el  método  podría  no  converger. 


A. 3.  El  método  de  la  potencia  con  desplazamiento 


La  mayor  desventaja  del  método  de  la  potencia  es  que  su  velocidad  de  convergencia  es  lenta  cuando  la 
razón  de  predominio  r  =  ^  de  los  dos  mayores  valores  propios  en  módulo  está  próxima  a  1.  Sin  embargo, 
la  velocidad  de  convergencia  se  puede  acelerar  mediante  varias  estrategias.  La  estrategia  más  simple  consiste 
en  utilizar  el  método  de  la  potencia  con  desplazamiento.  Sabemos  que  A  y  A  —  ql  tienen  el  mismo  conjunto 
de  vectores  propios,  y  para  cada  valor  propio  A  de  A ,  tenemos  el  valor  propio  A  —  q  de  A  —  ql.  Esto  es, 


(. A  —  ql)v  =  Av  —  qv  =  Av  —  qv  =  (A  —  g)v. 


Por  lo  tanto,  si  restamos  q  de  todos  los  elementos  diagonales  de  A,  cada  valor  propio  se  reduce  por  el  mismo 
factor  y  los  vectores  propios  no  cambian.  El  método  de  la  potencia  se  puede  utilizar  ahora  así: 

zk  =  (A-ql)  wk, 

1 

wk+i  =  - zk. 

«fc+i 

Por  ejemplo,  si  20  y  —18  son  los  dos  valores  propios  mayores  en  módulo,  la  razón  de  predominio  r  =  0.9  está 
próxima  a  1  y  la  velocidad  de  convergencia  será  entonces  lenta.  Sin  embargo  si  elegimos  q  =  4(10  +  18)  =  14 
entonces  los  nuevos  valores  propios  son  6  y  —32,  de  manera  que  la  razón  de  predominio  es  r  =  0.1875  y  se 
obtendrá  mayor  velocidad  de  convergencia. 

Por  supuesto  que  la  elección  de  q  es  difícil,  a  menos  que  sepamos  a  priori  una  estimación  de  los  valores 
propios.  Una  forma  de  obtener  una  estimación  de  los  valores  propios  es  utilizando  el  siguiente  resultado, 
conocido  como  teorema  de  los  círculos  de  Gerschgorin: 

Sean  A  una  matriz  cuadrada  de  orden  n  y  C¿  el  círculo  del  plano  complejo  con  centro  y 

radio  la¿jl’  es  dedr!  C¿  =  {z  £  C;  | z  —  |  <  r.¿}  .  Entonces,  los  valores  propios  de 

A  están  contenidos  en  D  =  (J”=1  C\.  Además,  si  la  unión  de  k  de  estos  círculos  no  se  corta  con 
los  restantes  n  —  k,  entonces  dicha  unión  contiene  precisamente  k  valores  propios  (contando  las 
multiplicidades) . 


114 


COMPLEMENTO  A.  VALORES  PROPIOS  Y  VECTORES  PROPIOS 


Ejemplo.  Dada  la  matriz 

observamos  que  todos  sus  valores  propios  son  reales,  puesto  que  A  es  simétrica  y  los  círculos  de  Gerschgorin 
son: 

Ci  es  el  círculo  con  centro  en  (2,0)  y  radio  =  3  +  0  =  3, 

C2  es  el  círculo  con  centro  en  (8,  0)  y  radio  =  3  +  |  —  2|  =  5, 

C3  es  el  círculo  con  centro  en  (—4,  0)  y  radio  =  0  +  |  —  2|  =  2. 

La  unión  de  estos  círculos  es 


D  =  [-1, 5]  U  [3, 13]  U  [-6,  -2]  =  [-6,  -2]  U  [-1, 13]. 

Como  C 1  y  C2  son  disjuntos  con  C3,  véase  la  figura [A~Tj  hay  dos  valores  propios  en  Ci  U  C2  y  uno  en  C3.  En 
efecto,  los  valores  propios  de  A  son:  Ai  =  9.4969,  A2  =  0.8684  y  A3  =  —4.3653.  □ 


C2 


Figura  A.l:  Círculos  de  Gerschgorin  para  la  matriz  A  del  ejemplo. 


Notemos  que  no  hay  garantía  de  que  un  círculo  contenga  valores  propios  a  menos  que  éste  esté  aislado  de 
los  otros.  El  teorema  de  los  círculos  de  Gerschgorin  se  puede  aplicar  para  obtener  una  conjetura  preliminar 
del  desplazamiento ,  como  mostramos  en  el  siguiente  ejemplo. 

Ejemplo.  En  el  ejemplo  anterior  hemos  visto  que  los  valores  propios  de  la  matriz  A  están  en  D  =  [—1,5]  U 
[3, 13]  U  [—6,  —2]  =  [—6,  —2]  U  [—1, 13],  de  manera  que  para  calcular  el  mayor  valor  propio  en  módulo,  podemos 
utilizar  el  método  de  la  potencia  con  desplazamiento  poniendo  el  valor  del  desplazamiento  q  =  13.  □ 

Comentario  adicional.  >  El  método  de  la  potencia  con  desplazamiento  permite  calcular  el  valor  propio 
más  cercano  a  un  número  dado,  y  para  que  su  aplicación  sea  efectiva  necesitamos  cierto  conocimiento 
a  priori  de  la  situación  de  los  valores  propios  de  la  matriz,  que  puede  conseguirse  inspeccionando  los 
círculos  de  Gerschgorin. 


A. 4.  El  método  de  la  potencia  inversa 

También  podemos  obtener  el  menor  valor  propio  en  módulo  de  forma  similar  al  de  mayor  módulo,  mediante 
el  método  de  la  potencia  inversa.  Si  la  matriz  A  es  ivertible  y  A  es  un  valor  propio  de  A  y  v  su  vector  propio 
asociado,  entonces  j  es  un  valor  propio  de  A-1  asociado  al  mismo  vector  propio  v,  ya  que  A_1v  =  jV  si 
Av  =  Av.  Aplicando  el  método  de  la  potencia  a  A~1  podemos  obtener  una  aproximación  al  menor  valor 
propio  de  A  en  módulo  (siempre  que  exista) . 

Eligiendo  un  vector  inicial  adecuado  v  ^  0,  en  el  primer  paso  obtenemos  u  tal  que  Au  =  v,  que  es 
equivalente  a  u  =  A_1v.  Obviamente  la  matriz  inversa  A^1  se  tiene  que  calcular  con  anterioridad.  En  la 
práctica,  sin  embargo,  como  calcular  la  inversa  de  una  matriz  es  computacionalmente  ineficiente  y  no  deseable, 
se  suele  resolver  el  sistema  lineal  Au  =  v  (utilizando  habitualmente  un  método  de  factorización  LU ).  A  partir 
de  aquí  funciona  todo  igual  que  en  el  método  de  la  potencia. 


A. 5.  CÁLCULO  DE  TODOS  LOS  VALORES  PROPIOS 
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A. 5.  Cálculo  de  todos  los  valores  propios 

Una  vez  que  el  mayor  (o  menor)  valor  propio  en  módulo  es  conocido,  se  puede  utilizar  el  método  de 
la  potencia  con  desplazamiento  para  encontrar  los  otros  valores  propios.  Este  método  utiliza  la  siguiente 
propiedad  importante  de  las  matrices  y  sus  valores  propios: 

Dado  Av  =  Av,  si  Ai  es  el  mayor  (o  menor)  valor  propio  en  módulo  de  A,  obtenido  mediante  el 
método  de  la  potencia  (o  el  método  de  la  potencia  inversa),  entonces  los  nuevos  valores  propios 
de  la  matriz  desplazada  A  —  Ai I  son  0,  A2  —  Ai,  A3  —  Ai, . . . ,  A„  —  Ai. 

Esto  se  puede  ver  fácilmente  porque  los  valores  propios  de  A  —  Ai /  cumplen 


(A  —  Ai /)v  =  /uv 


(A.4) 


donde  p  es  el  valor  propio  de  la  matriz  desplazada  A  —  Ai I.  Pero,  como  Av  =  Av,  entonces  (A.4 1  es  (A  — 
Ai)v  =  /ív,  donde  A  =  Ai,  A2, . . . ,  A„.  Por  lo  tanto,  los  valores  propios  de  la  matriz  desplazada  A  —  Ai /  son 
/z  =  0,  A2  —  Ai,  A3  —  Ai, . . . ,  A„  —  Ai,  y  los  vectores  propios  son  los  mismos  que  los  de  A.  Ahora  si  se  aplica 
el  método  de  la  potencia  a  la  matriz  desplazada  A  —  Ai/,  después  de  haberse  aplicado  a  A  para  calcular 
Ai,  se  puede  calcular  el  mayor  valor  propio  en  módulo  de  la  matriz  desplazada.  Entonces,  el  valor  propio 
Xk  se  puede  determinar  como  Afe  =  /ife  +  Ai.  El  resto  de  valores  propios  se  pueden  calcular  repitiendo  este 
proceso  k  —  2  veces,  donde  cada  vez  la  matriz  desplazada  es  A  —  Afe/  y  Afc  el  valor  propio  obtenido  a  partir 
del  desplazamiento  anterior. 


Comentario  ADICIONAL.  >  La  combinación  del  teorema  de  Gerschgorin,  el  método  de  la  potencia  inversa 
y  el  método  de  la  potencia  con  desplazamiento  puede  ser  útil  para  calcular  los  valores  propios  de  una 
matriz.  Por  ejemplo,  si  hay  un  círculo  de  Gerschgorin  con  un  valor  propio  asociado,  podemos  llevar  a 
cabo  un  desplazamiento  q  similar  al  centro  de  dicho  círculo  para  que  el  valor  propio  correspondiente 
de  la  matriz  desplazada  esté  próximo  a  cero  y  ahora  aplicar  el  método  de  la  potencia  inversa  para 
calcularlo.  Después  basta  con  invertir  el  valor  obtenido  y  deshacer  el  desplazamiento. 


Notas  finales 

■  Una  vez  calculado  el  valor  propio  dominante,  también  se  puede  utilizar  el  método  de  la  potencia  para 
determinar  los  demás  valores  propios  de  una  matriz  mediante  técnicas  de  deflación ,  que  consisten  en 
construir  una  nueva  matriz  B  cuyos  valores  propios  son  los  mismos  que  los  de  A,  excepto  el  dominante, 
que  se  sustituye  por  0  como  valor  propio  de  B.  Por  tanto,  si  A2  «domina»  a  A3,  A4, . . . ,  An,  podemos 
aplicar  de  nuevo  el  método  de  la  potencia  a  la  matriz  B  para  calcular  A2,  y  así  sucesivamente.  Véase 
¡7]  para  el  método  concreto  de  Wielandt. 

■  Hay  una  gran  variedad  de  métodos  para  calcular  los  valores  propios  de  una  matriz,  la  mayoría  se  base 
en  un  proceso  de  dos  etapas:  en  la  primera  se  transforma  la  matriz  original  en  una  matriz  más  simple 
que  conserve  todos  los  valores  propios  de  la  matriz  original,  y  en  la  segunda  se  determinan  los  valores 
propios  mediante  un  método  iterativo.  Muchos  de  estos  métodos  están  diseñados  para  tipos  especiales 
de  matrices.  Cuando  se  buscan  los  valores  propios  de  una  matriz  general  cualquiera,  los  métodos  LR 
de  Rutishauser  y  QR  de  Francis  son  los  más  importantes.  Aunque  el  método  QR  es  menos  eficiente, 
frecuentemente  es  el  preferido  porque  es  más  estable.  En  m  se  pueden  ver  varios  métodos. 


A. 6.  Ejercicios 


1.  Calcúlese  el  mayor  y  el  menor  valor  propio  en  módulo  de  las  siguiente  matrices: 


A  = 


2  2  -1  \ 
-59-3, 
-4  4  1  / 


B  = 


1  0  0  \ 
2-12, 
4-45/ 


(ru) 

\  0  0  2  / 
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2.  Utilícese  el  teorema  de  los  círculos  de  Gerschgorin  para  hallar  un  desplazamiento  adecuado  para  calcular 
el  mayor  valor  propio  en  módulo  de  la  matriz 


Compárense  los  números  de  iteraciones  que  utilizan  el  método  de  la  potencia  y  el  método  de  la  potencia 
con  desplazamiento. 

3.  Verifiqúese  que  el  método  de  la  potencia  no  converge  al  mayor  valor  propio  en  módulo  de  la  matriz 

/II  2  3 

1  °  -i  2 

oo-l-l 

\  0  0  1  o 


Expliqúese  por  qué. 

4.  Sea  la  matriz 

/O  0  2  4  \ 

i  0  0  0 

0  ±  0  0  ' 

V  o  0  I  o 

a)  Determínese  una  región  del  plano  complejo  que  contenga  a  todos  los  valores  propios  de  A. 

b )  Encuéntrense  el  mayor  valor  propio  en  módulo  de  A  y  su  vector  propio  asociado. 

c)  Hállense  el  resto  de  valores  propios  de  A. 

d)  Calcúlense  los  valores  propios  de  A  a  partir  de  su  polinomio  característico  y  aplicando  el  método 
de  Newton. 


5.  Dada  la  matriz 


utilícese  el  método  de  la  potencia  para  calcular  el  radio  espectral  de  A  con  la  norma  infinito. 


Complemento  B 


Introducción  a  las  ecuaciones 
diferenciales  en  derivadas  parciales 

B.l.  Introducción 

Actualmente  la  teoría  de  las  ecuaciones  diferenciales  en  derivadas  parciales  (abreviadamente,  EDP)  es 
uno  de  los  campos  más  importantes  de  estudio  de  las  matemáticas,  ya  que  estas  ecuaciones  aparecen  frecuen¬ 
temente  en  muchas  ramas  de  la  física  y  de  la  ingeniería,  así  como  de  otras  ciencias. 

En  muchas  formulaciones  de  modelos  matemáticos  se  utilizan  derivadas  parciales  para  representar  can¬ 
tidades  físicas.  Estas  derivadas  siempre  dependen  de  más  de  una  variable  independiente,  generalmente  las 
variables  espacio  x,  y, ...  y  la  variable  tiempo  t.  Tales  formulaciones  tienen  una  o  más  variables  dependientes, 
que  son  funciones  desconocidas  de  las  variables  independientes.  Las  ecuaciones  resultantes  se  llaman  ecua¬ 
ciones  diferenciales  en  derivadas  parciales,  que  junto  con  condiciones  iniciales  y  de  contorno,  representan 
fenómenos  físicos. 

En  este  capítulo  daremos  una  brevísima  introducción  a  las  EDP.  Este  es  un  tema  tan  amplio  que  necesitaría 
por  sí  solo  de  un  texto  completo  para  una  simple  introducción.  Mostraremos  los  aspectos  más  básicos  de 
las  EDP,  limitándonos  al  estudio  de  las  EDP  de  segundo  orden,  ya  que  cubren  las  más  características  e 
importantes  ecuaciones  de  la  física  matemática:  la  ecuación  de  ondas,  la  ecuación  del  calor  y  la  ecuación  de 
Laplace.  Introduciremos  meramente  ciertos  conceptos  fundamentales  y  algún  método  básico  de  resolución. 


B.2.  EDP  y  sus  soluciones 


Recordemos  en  primer  lugar  que  una  EDP  es  una  ecuación  diferencial  que  contiene  derivadas  parciales 
de  una  o  más  variables  dependientes  respecto  a  una  o  más  variables  independientes.  Por  ejemplo,  si  u  es  una 
función  de  las  variables  independientes  x  e  y,  toda  ecuación  que  contenga  o  o  derivadas  de  orden 
superior,  y  también  u,  x  o  y,  es  una  EDP.  Algunos  ejemplos  importantes  de  las  ciencias  físicas  son: 


d2u 

_„2d2u 

dt 2 

dx2 

du 

d2u 

di  Z 

=  l3d X2 

d2u 

d2u 

dx 2 

dy2 

d2u 

d2u 

dx2 

dy2 

d2u 

dx2 

d2u 

+  + 

dy2 

es  la  ecuación  unidimensional  de  ondas , 


=  0  es  la  ecuación  tridimensional  de  Laplace. 
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En  las  dos  primeras  EDP,  la  función  incógnita  u  es  una  función  de  la  coordenada  x  y  del  tiempo  t:  u  =  u(x,  t). 
En  las  tercera  y  cuarta  EDP,  la  función  u  depende  de  las  dos  coordenadas  de  un  punto  en  el  plano,  y  en 
última  la  función  depende  de  las  tres  coordenadas  de  un  punto  en  el  espacio. 

Llamamos  orden  de  una  EDP  al  que  tiene  la  derivada  de  mayor  orden  que  aparece  en  la  ecuación.  En 
los  ejemplos  anteriores  todas  las  EDP  son  de  segundo  orden. 

Al  igual  que  para  las  EDO,  hay  varios  tipos  estándares  de  EDP  importantes  que  se  dan  con  frecuencia 
en  los  modelos  matemáticos  de  los  sistemas  físicos,  y  cuyas  soluciones  se  pueden  expresar  mediante  funciones 
elementales.  Una  solución  de  una  EDP  es  una  relación  explícita  o  implícita  entre  las  variables,  relación  que 
no  contiene  derivadas  y  que  satisface  idénticamente  la  ecuación.  En  determinados  casos  muy  simples  se  puede 
obtener  una  solución  inmediatamente. 


Ejemplo.  Si  consideramos  la  EDP  de  primer  orden 

du 


dx 


2  ,  2 
=  x  +y  , 


en  la  que  u  es  la  variable  dependiente  y  x  e  y  son  las  variables  independientes,  la  solución  es 


u{x,y) 


(x2  +  y2)  dx  +  <¡>(y), 


donde  f  (x2  +  y2)  dx  indica  una  «integración  parcial»  respecto  a  x,  manteniendo  y  constante,  y  ^  es  una 
función  arbitraria  que  depende  solo  de  y.  Por  tanto,  la  solución  de  la  EDP  es 


u{x,y)  =  y  +xy2  +  (j){y).  □ 


Ejemplo.  Sea  la  EDP  de  segundo  orden 


d2u 

dydx 


=  x  -y. 


Primero  la  escribimos  en  la  forma 

—  ^  =  a:3  -y 

dy  V dx)  V 

y  la  integramos  parcialmente  respecto  a  y,  manteniendo  x  constante,  con  lo  que  obtenemos 


du  o  1  o  ,  /  \ 

Q-x=*y--2y  +*(*)> 

donde  <f>  es  una  función  arbitraria  de  x.  Integramos  ahora  este  resultado  parcialmente  respecto  a  x ,  mante¬ 
niendo  y  constante,  con  lo  que  obtenemos  la  solución  de  la  EDP 

u{x,  y)  =  ^x4y  -  i xy 2  +  f(x)  +  g(y), 


donde  /  es  una  función  arbitraria  de  x  que  está  definida  por  f{x)  =  f  <j>{x)  dx  y  g  es  una  función  de  y  también 
arbitraria.  □ 


Como  resultado  de  estos  dos  sencillos  ejemplos  observamos  que  mientras  que  las  EDO  tienen  soluciones 
que  dependen  de  constantes  arbitrarias,  las  soluciones  de  las  EDP  dependen  de  funciones  arbitrarias.  En 
particular,  observamos  que  la  solución  de  la  EDP  de  primer  orden  contiene  una  función  arbitraria  y  que  la 
solución  de  la  EDP  de  segundo  orden  contiene  dos  funciones  arbitrarias.  En  general,  la  solución  de  una  EDP 
contiene  un  cierto  número  de  funciones  arbitrarias,  a  menudo  n  funciones  para  una  ecuación  de  orden  n. 

Nota.  La  naturaleza  de  un  problema  matemático  típico  que  se  refiere  a  una  EDP  y  que  se  origina  en  la 
formulación  matemática  de  algún  problema  físico  consta  no  solo  de  la  propia  ecuación  diferencial,  sino  que 
contiene  también  ciertas  condiciones  suplementarias  (denominadas  condiciones  de  contorno,  condiciones  ini¬ 
ciales  o  ambas) .  El  número  y  la  naturaleza  de  estas  condiciones  depende  de  la  naturaleza  del  problema  físico 
que  ha  originado  el  problema  matemático.  La  solución  del  problema  ha  de  satisfacer  tanto  la  ecuación  dife¬ 
rencial  como  las  condiciones  suplementarias.  Con  otras  palabras,  la  solución  del  problema  completo  (ecuación 
diferencial  más  condiciones)  es  una  solución  particular  de  la  EDP  del  problema. 


B.3.  EDP  LINEALES  DE  SEGUNDO  ORDEN 
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B.3.  EDP  lineales  de  segundo  orden 


Consideramos  brevemente  la  clase  de  EDP  que  aparecen  con  más  frecuencia,  que  es  la  de  las  denominadas 
EDP  lineales  de  segundo  orden.  Una  EDP  lineal  de  segundo  orden  con  dos  variables  independientes  ®  e  y  es 
una  ecuación  de  la  forma: 

AuXx  Y  Buxy  Y  C''Uyy  Y  Fux  Y  EUy  Y  Fu  =  G,  (B.l) 

donde  A ,  B,  C,  D,  E,  F  y  G  son  funciones  de  x  e  y.  Supongamos  que  A,  B  y  C  no  se  anulan  simultáneamente. 
Si  G  =  0,  la  EDP  (B.l  |  se  reduce  a 

Auxx  Y  Euxy  Y  Giiyy  Dux  -f-  Euy  Fu  —  0.  (B.2) 

Para  esta  clase  de  EDP  podemos  enunciar  el  siguiente  teorema  fundamental  con  respecto  a  sus  soluciones: 


Sean  n  soluciones  u\,  U2,  ■  ■  ■ ,  un  de  la  EDP  (B.2 1  en  una  región  1Z  del  plano  XY .  La  combinación 
lineal  c\U\  +  C2U2  +  •  •  •  +  cnun,  donde  c\,  C2, . . . ,  cn  son  constantes  arbitrarias,  es  también  una 
solución  de  la  EDP  ( B.2 )  en  7Z. 

Consideramos  ahora  una  clase  especial  importante  de  EDP  lineales  de  segundo  orden,  las  denominadas 
EDP  lineales  homogéneas  de  segundo  orden  con  coeficientes  constantes.  Una  ecuación  de  esta  clase  es  de  la 
forma 

auxx  Y  huxy  +  cuyy  =  0  con  a,  b  y  c  contantes.  (B.3) 


La  palabra  homogénea  hace  referencia  aquí  al  hecho  de  que  todos  los  términos  en  ( B.3  >  contienen  derivadas 
del  mismo  orden  (el  segundo). 


Buscamos  ahora  una  solución  de  ( B.3 )  en  la  forma: 

u{x,y )  =  f(y  +  Xx), 


(B.4) 


donde  /  es  una  función  arbitraria  de  su  argumento  y  A  es  una  constante.  Derivando  (B.4),  obtenemos 
uxx{x,y)  =  X2f"{y  +  Xx),  uxy(x,  y)  =  Xf"(y  +  Xx),  uyy(x,y)  =  f"(y  +  Xx), 


y  sustituyéndolas  en  (B.3 )  da 

aX2f"(y  +  Xx)  +  bXf" (y  +  Xx)  +  cf" (y  +  Xx)  =0  =>  f" (y  +  Xx)  [a A2  +  bX  +  c]  =0, 

de  manera  que  u(x,  y)  =  f(y  +  Xx)  es  una  solución  de  4b3|  si  A  satisface  la  ecuación  de  segundo  grado 

aX  bX  -)-  c  =  0, 


que  llamaremos  ecuación  condicionante. 


Consideramos  ahora  los  siguientes  cuatro  casos  de  la  EDP  (B.3 1 ,  véase  m 


1.  a/0y  las  raíces  de  la  ecuación  condicionante  diferentes, 

2.  ayí  0  y  las  raíces  de  la  ecuación  condicionante  iguales, 

3.  a  =  0,  b  0, 

4.  a  =  0,  b  =  0  y  c  0. 


En  el  caso  1,  la  EDP  ( B.3  >  posee  dos  soluciones  u(x,y)  =  f{y+  Ai®)  y  u{x,y)  = 
son  dos  funciones  arbitrarias  de  sus  respectivos  argumentos  y  Ai  y  A2  son  las  raíces 
condicionante.  Aplicando  el  teorema  fundamental  anterior  se  deduce  que 


g{y  +  X2x),  donde  /  y  g 
distintas  de  la  ecuación 


u(x,  y)  =  f(y  +  Xix)  +  g(y  +  X2x) 


es  una  solución  de  la  EDP  (B.3). 

En  el  caso  2,  la  EDP  (B.3 )  posee  la  solución  u(x,y)  =  f(y  +  Xix),  donde  /  es  una  función  arbitraria  de 
su  argumento  y  Ai  es  la  raíz  doble  de  la  ecuación  condicionante.  Además,  se  puede  comprobar  fácilmente  que 
en  este  caso  la  EDP  (B.3 1  posee  también  la  solución  u{x,  y)  =  xg(y  +  Ai:r),  donde  g  es  una  función  arbitraria 
de  su  argumento.  Según  el  teorema  fundamental  anterior  vemos  que 


u{x,  y)  =  f(y  +  Ai®)  +  xg{y  +  Ai®) 
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es  una  solución  de  la  EDP  (B.3|). 

En  el  caso  3,  la  ecuación  condicionante  se  reduce  a  bX  +  c  =  0,  por  lo  que  tiene  una  única  raíz  Ai  =  —c/b. 
La  EDP  (B.3 1  posee  la  solución  u(x,  y)  =  f(y  +  Aix),  donde  /  es  una  función  arbitraria  de  su  argumento.  Se 
puede  comprobar  además  que  en  este  caso  g(x),  donde  g  es  una  función  arbitraria  de  x  solamente,  es  también 
una  solución  de  la  EDP  (B.3 ) .  Según  el  teorema  fundamental  anterior  tenemos  entonces  que 

■u(x,  y)  =  f(y  +  \íx)  +  g{x) 


es  una  solución  de  la  EDP  (B.3 1. 

Finalmente,  en  el  caso  4,  la  ecuación  condicionante  se  reduce  a  c  =  0,  lo  que  es  imposible.  Vemos  que  en 
este  caso  no  existen  soluciones  de  la  forma  ( B .4 ) .  No  obstante,  la  EDP  es  ahora  simplemente 


d2u  _  n  di  du\  _ 

°  dy2  °  dy  V<9yJ 


Integrando  parcialmente  respecto  a  y  dos  veces,  obtenemos  u(x,  y)  =  f{x)  +  yg( x),  donde  /  y  g  son  funciones 
arbitrarias  de  x  solamente.  Por  tanto,  en  este  caso, 


u{x,y)  =  f(x)  +  yg{x) 


es  una  solución  de  la  EDP  (B.3 1. 

Notemos  que  toda  EDP  con  coeficientes  constantes  de  la  forma  ( B.3 )  está  dentro  de  una  y  solo  una  de 
las  cuatro  categorías  cubiertas  por  los  casos  1  al  4. 


Ejemplo.  Sea 


'U'XX  buxy  -p  Gllyy  -  0. 

La  ecuación  condicionante  correspondiente  a  esta  EDP  es  A2  —  5 A  +  6  =  0,  que  posee  dos  raíces  diferentes 
Ai  =  2  y  A3  =  3.  Estamos  entonces  en  el  caso  1,  por  lo  que 


u{x,  y)  =  f(y  +  2x)  +  g(y  +  3x) 


es  una  solución  de  la  EDP  conteniendo  dos  funciones  arbitrarias  /  y  g  de  sus  respectivos  argumentos.  □ 


Acabamos  esta  sección  clasificando  las  EDP  de  la  forma  (B.l).  La  clasificación  de  estas  EDP  surge  por 
su  analogía  con  la  ecuación  de  las  cónicas  en  el  plano: 


Ax2  +  Bxy  +  Cy2  +  Dx  +  Ey  +  F  =  0. 

Así,  dependiendo  de  que  la  cantidad  B2  —  4 AC  sea  positiva,  negativa  o  nula,  hablaremos  respectivamente  de 
EDP  hiperbólicas,  elípticas  o  parabólicas. 

Generalizando  la  definición  anterior,  decimos  que  la  EDP  (B.l  I  es  de  tipo 


1.  hiperbólico  en  todos  los  puntos  en  los  que  B 2  —  4 AC  >  0, 

2.  elíptico  en  todos  los  puntos  en  los  que  B2  —  4 AC  <  0, 

3.  parabólico  en  todos  los  puntos  en  los  que  B 2  —  4 AC  =  0. 


Esta  clasificación  puramente  matemática  se  relaciona  con  una  división  global  de  los  fenómenos  físicos  que 
se  describen  mediante  tales  ecuaciones,  a  saber:  procesos  vibratorios  (ecuaciones  hiperbólicas),  estacionarios 
(ecuaciones  elípticas),  o  de  difusión  (ecuaciones  parabólicas).  Es  por  ello  que  las  soluciones  de  cada  uno 
de  los  tipos  de  ecuaciones  tienen  particularidades  que  le  son  específicas  (si  bien  pueden  existir  puntos  de 
contacto).  Por  ejemplo,  las  ecuaciones  hiperbólicas  se  caracterizan  por  poseer  soluciones  en  forma  de  ondas 
que  se  desplazan  con  una  velocidad  finita.  Las  ecuaciones  elípticas  poseen  soluciones  suaves  (infinitamente 
diferenciables),  etc.  Las  ecuaciones  parabólicas,  en  cierto  sentido,  tienen  propiedades  intermedias  entre  las 
hiperbólicas  y  las  elípticas. 

Ilustraremos  esta  clasificación  con  las  tres  EDP  más  famosas  de  la  física  matemática. 


Ejemplo.  La  ecuación  uxx  —  uvv  =  0  es  hiperbólica  puesto  que  A  =  1,  B  =  0,  C  =  —  1  y  B2  —  4 AC  =  4  >  0. 
Es  un  caso  especial  de  la  denominada  ecuación  unidimensional  de  ondas ,  que  es  satisfecha  por  los  pequeños 
desplazamientos  transversales  de  los  puntos  de  una  cuerda  vibrante.  Esta  EDP  es  lineal  y  homogénea  con 
coeficientes  constantes  y  posee  la  solución 


u{x,  y)  =  f(y  +  x)  +  g(y  -  x), 


donde  /  y  g  son  funciones  arbitrarias  de  sus  respectivos  argumentos.  □ 
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Ejemplo.  La  ecuación  uxx  +  uyv  =  0  es  elíptica  puesto  que  A  =  1,  B  =  0,  C  =  1  y  B2  -  4 AC  =  — 4  <  0. 
Esta  EDP  se  denomina  ecuación  bidimensional  de  Laplace  y  es  satisfecha  por  la  temperatura  de  los  puntos 
de  una  placa  rectangular  delgada  en  estado  estacionario.  Observemos  que  esta  EDP  es  lineal  homogénea  con 
coeficientes  constantes,  por  lo  que  su  solución  es 

u(x,  y)  =  f(y  +  ix)  +  g(y  -  ix), 

donde  /  y  g  son  funciones  arbitrarias  de  sus  respectivos  argumentos.  □ 

Ejemplo.  La  ecuación  uxx  —  uy  =  0  es  parabólica  puesto  que  4  =  1,  B  =  C=  0yB2-  4  AC  =  0.  Es 
un  caso  especial  de  la  ecuación  unidimensional  del  calor  (o  ecuación  de  difusión),  que  es  satisfecha  por  la 
temperatura  de  un  punto  de  una  barra  homogénea.  Esta  EDP  no  es  homogénea.  □ 


B.4.  Forma  canónica  de  las  EDP  lineales  de  segundo  orden 


La  utilidad  de  la  clasificación  anterior  se  basa  esencialmente  en  la  posibilidad  de  reducir  (B.l),  en  ca¬ 
da  uno  de  los  tres  casos  mencionados,  a  una  forma  canónica  mediante  un  adecuado  cambio  de  variables 
independientes. 

Para  determinar  estas  formas  canónicas,  empezamos  considerando  un  cambio  genérico  de  variables  inde¬ 
pendientes: 

s  =  s{x,y)  y  t  =  t(x,y), 


donde  supondremos  que  s  y  t  son  funciones  de  x  e  y  dos  veces  derivables,  de  manera  que  el  jacobiano  de  la 
transformación , 

T  _  $X  Sy 

J  ~  t  t  ’ 

0X  lyy 


es  distinto  de  cero  en  la  región  en  que  estemos  interesados.  Entonces,  suponiendo  que  x  e  y  son  a  su  vez 
funciones  de  s  y  t  dos  veces  derivables,  las  derivadas  que  aparecen  en  (B.l)  se  transforman  en 


ux 

Uy 

'U'XX 

'Uxy 

uyy 


que  al  sustituir  en  (B.l)  da 


'U'S$x  H-  rUjttx 
'U'sSy  "B  Utty 

^ss^x  2'UstSxtx  "t"  'U'ttt'x  ^s^xx  H-  'Ujtt,xx 

'U-ss^x  Sy  -|-  Ust^Sxty  H-  Sy^x)  H-  ^tt^x^y  H-  'U's^xy  H-  'U't^xy 

'UssSy  "t"  2ustSyty  “h  'U'ttty  “1“  'Ujs$yy  "t"  'U'ttyy 


■A\uSs  B\ ust  H-  Utt  d"  í,  'U't)  0, 


(B.5) 


donde  R  es  una  función  lineal  en  u,  Ut,  us  e  independiente  de  las  derivadas  segundas.  Los  nuevos  coeficientes 
son 


A\  —  A sx  Bsxsy  Csy, 

B\  =  2ASXtX  +  B(sxty  +  SytX)  +  2  CSyty, 

Ci  =  At^.  +  Btxty  +  Cty. 


Obsérvese  que  la  naturaleza  de  (B.ll 
como  puede  comprobarse  fácilmente 


permanece  invariante  ante  la  transformación  efectuada,  puesto  que 


B\  -  4Ai  O-,  =  J2(B2  -  4 AC), 


y  por  tanto  la  ecuación,  después  del  cambio,  continúa  perteneciendo  a  la  misma  clase,  sin  más  que  exigir  que 
J  ±  0. 
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Ecuaciones  hiperbólicas 


En  el  caso  concerniente  a  la  forma  canónica  en  el  caso  hiperbólico,  si  elegimos  una  transformación  de 
coordenadas  tal  que  s(x,  y)  y  t{x,  y)  sean  dos  soluciones  de 


dy 


dx 


A  -B  +C  =  0 


dy 


dx 


es  decir, 


dy  B  +  y/B2  -  4 AC 


dx 


2  A 


dy  _  B-  \/B2  -  4 AC 
dx  2  A 


entonces  el  cambio  de  variables  s  =  s(x,  y)  y  t  =  t(x,y)  simplifica  la  EDP  (B.5)  como  sigue 

R 


Ust  = 


B, 


(B.6) 


que  se  denomina  primera  forma  canónica  de  las  EDP  hiperbólicas.  Las  curvas  descritas  al  hacer 

s(x,y )  =  constante  y  t(x,y)  =  constante 


se  denominan  curvas  características.  Un  tipo  de  curva  característica  para  una  EDP  dada  es  una  curva 
sobre  la  cual  la  solución  toma  un  valor  constante. 

Si  introducimos  nuevas  variables  w  y  z,  mediante  las  fórmulas 

s  +  t  s  —  t 


obtenemos 


.  R 

'U'WW  ^ZZ  —  4  T-,  ; 

-OI 


que  recibe  el  nombre  de  segunda  forma  canónica  de  las  EDP  hiperbólicas. 


Ecuaciones  elípticas 

En  este  caso  el  procedimiento  es  el  mismo  que  para  las  ecuaciones  hiperbólicas,  pero,  como  B2  —  4AC  <  0, 


(B.6)  tiene  como  soluciones  dos  funciones  complejas  conjugadas  s  =  a  +  i/3yt  =  a  —  i/3  =  s.  Siguiendo  el 


mismo  procedimiento  que  en  el  caso  hiperbólico  y,  para  no  trabajar  con  cantidades  complejas,  considerando 
el  cambio  de  variables 

s  +  t  s  —  t 

w  =  — - —  =  a  y  z  =  n .  =  p, 


2  i 


llegamos  a  la  forma  canónica  de  las  EDP  elípticas 


■  Ur,r,  =  -- 


4  R 

’bT 


Ecuaciones  parabólicas 


Como  B2  —  4 AC  =  0,  de  (B.6 1  vemos  que  se  satisface  la  misma  EDO 


dy_  =  B_ 
dx  2  A 


Las  soluciones  de  esta  EDO,  s(x,  y)  =  constante,  son  las  características  de  la  EDP  (B.l  l.  (Para  las  ecuaciones 
parabólicas  solo  existe  una  familia  de  curvas  características.)  Tomando  s  =  s(x,y),  podemos  tomar  una 
función  arbitraria  t  =  t(x,  y)  que  complete  el  cambio  de  variables  y  tal  que  el  jacobiano  J  /  0.  Se  suele  tomar 
t  =  y.  En  resumen,  la  ecuación  se  reduce  a  la  forma  canónica  de  las  EDP  parabólicas 


utt  =  - 


R 

Ct' 
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Caso  particular:  A,  B  y  C  constantes 

Si  A,  B  y  C  son  constantes,  B2  —  4 AC  también  es  constante,  y  las  EDO  ( B.6  >  se  pueden  escribir  como 


,{  ,  B  -  VB2  -  4AC 

y  \x)  = - ai - = 


,,  .  B  A  VB 2  -  4 AC  . 

y  W  = - Al - =  A25 


2A  3  w  2 A 

es  decir,  dos  EDO  de  primer  orden,  cuyas  soluciones  se  obtienen  mediante  integración  directa 


y(x)  =  Xix  A  A'i  e  y(x)  =  X2x  A  K2. 

Como  las  dos  curvas  características  dependen  de  una  constante  arbitraria,  basta  elegir  s  como  una  de  ellas  y 
t  como  la  otra  para  obtener  el  cambio  de  variables 


s  =  y  —  Xix,  t  =  y  —  X2x. 

Obsérvese  que  Ai  y  A2  son  las  raíces  de  la  ecuación  de  segundo  grado  AX2  —  B X  A  C  =  0. 

1.  Caso  hiperbólico:  hay  dos  familias  de  rectas  características.  El  cambio  de  variábales  es 

s  =  y~  Xix  y  t  =  y  —  X2x. 


2.  Caso  elíptico:  no  hay  características.  El  cambio  de  variábales  es 

2Ay  —  Bx 


s  = 


V4AC  -  B2  ’ 
puesto  que,  como  s  =  y  —  X\x,  se  tiene  que 

2 Ay  -  Bx  .  V4AC  -  B2 


que  es  equivalente  a 


2  A  2  A 

2Ay  —  Bx 


t  =  x, 


x  =  constante, 


+  ix  =  constante. 


V4 AC  -  B'2 

3.  Caso  parabólico:  hay  una  familia  de  rectas  características.  El  cambio  de  variábales  es 

B 

S  =  y~2 ~AX'  t  =  V’ 


En  algunos  casos  será  posible  hallar  elementalmente  la  solución  general  de  la  EDP  (B.l)  una  vez  escrita 
en  su  forma  canónica,  pero  en  la  mayoría  de  los  casos  será  imposible.  Identifiquemos  dos  casos  en  los  que  si 
es  posible: 

i)  Si  solo  aparecen  derivadas  respecto  a  una  variable.  Por  ejemplo, 

utt  +  E\Ut  +  F\u  =  G\. 

La  EDP  se  integra  considerando  la  otra  variable  como  parámetro.  La  EDP  es  parabólica. 

ii)  Si  solo  aparecen  ust  y  una  de  las  derivadas  primeras.  Por  ejemplo, 


ust  +  Dius  —  G\. 

La  EDP  se  resuelve  haciendo  el  cambio  us  =  v,  ya  que  la  ecuación  resultante  vt  +  D±v  =  G\  se  puede 
integrar  considerando  s  como  parámetro.  La  EDP  es  hiperbólica. 

Ejemplo.  Sea  la  EDP 

4uXx  5uXy  A  ^yy  A  Ux  A  Uy  —  2. 

En  primer  lugar,  vemos  que  A  =  4,  B  =  5,  C=lyB2  —  4AC  =  9  >  0,  de  modo  que  la  ecuación  es 
hiperbólica.  Como  A,  B  y  C  son  constantes,  consideramos  la  transformación  s  =  y  —  Xix  y  t  =  y  —  X2x, 
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donde  Ai  y  A2  son  las  raíces  de  la  ecuación  de  segundo  grado  4A2  —  5A  +  1  =  0.  Luego,  Ai  =  |  y  A2  =  1,  de 
manera  que  s  =  y  —  |  y  t  =  y  —  x.  Aplicando  esta  transformación  a  la  EDP,  obtenemos  su  forma  canónica 

us  8 
Ust~T~  9 

Hacemos  ua  =  v  y  la  ecuación  resultante,  vt  =  |  —  |,  es  una  EDO  separable  de  primer  orden,  manteniendo  s 
constante.  Por  tanto,  v  =  es  +|,  donde  4>  es  una  función  arbitraria  de  s.  Integramos  a  continuación  este 
resultado  parcialmente  respecto  a  s,  manteniendo  t  constante,  para  obtener 

t  8 

u(s,t)  =  f(s)e 3  +-s  +  g(t), 

donde  /  es  una  función  arbitraria  de  s  que  está  definida  por  /(s)  =  J  <p(s)  ds  y  g  es  una  función  arbitraria 
de  t.  En  consecuencia, 

u(x,y)  =  f  (y  -  0eí(y_x)-0  (y-  0  +g(y~x), 
donde  /  y  g  son  dos  funciones  arbitrarias  de  sus  respectivos  argumentos.  □ 


B.5.  Separación  de  variables 


Si  una  EDP  con  dos  o  más  variables  independientes  puede  reducirse  a  un  conjunto  de  EDO,  una  para 
cada  variable,  la  ecuación  se  dice  separable.  Las  soluciones  de  la  EDP  son  entonces  los  productos  de  las 
soluciones  de  las  EDO. 

En  esta  sección  introducimos  el  método  de  separación  de  variables ,  que  es  un  método  fundamental  y 
potente  para  obtener  soluciones  de  ciertos  problemas  que  implican  EDP.  Aunque  la  clase  de  problemas  a  los 
que  se  puede  aplicar  este  método  es  relativamente  limitada,  incluye  no  obstante  muchos  casos  de  gran  interés 
físico. 

El  desarrollo  del  método  requiere  conectar  con  dos  clases  importantes  de  problemas,  que  históricamente 
surgieron  precisamente  de  él.  Son  los  problemas  de  contorno  con  EDO  y  el  problema  de  representación  de  una 
función  en  forma  de  serie  trigonométrica.  A  dichas  series  trigonométricas  se  les  denomina  series  de  Fourier', 
su  estudio  se  escapa  de  los  objetivos  de  este  texto,  pero  sus  propiedades  se  pueden  encontrar  en  cualquier 
texto  sobre  EDP. 

El  enunciado  matemático  de  tales  problemas  contiene  una  EDP  y  ciertas  condicones  suplementarias 
(condiciones  de  contorno,  condiciones  iniciales  o  ambas),  y  la  solución  del  problema  es  una  función  que 
satisface  tanto  la  EDP  como  las  condiciones  suplementarias. 

Si  suponemos,  por  ejemplo,  una  EDP  con  una  sola  variable  dependiente  u  que  es  una  función  de  dos 
variables  independientes  x  e  y,  la  idea  del  método  de  separación  de  variables  consiste  en  buscar  una  solución 
de  la  EDP  lineal  de  orden  dos  en  la  forma  u(x,  y)  =  X(x)Y(y).  En  el  caso  en  que  sea  aplicable  este  método, 
su  aplicación  lleva  tres  pasos: 

1.  obtención  de  dos  EDO, 

2.  obtención  de  las  soluciones  de  las  dos  EDO  que  cumplan  las  condiciones  de  contorno, 

3.  formación  de  una  combinación  lineal  infinita  de  las  soluciones  para  satisfacer  las  condiciones 
iniciales  del  problema. 

El  paso  3  se  consigue  primeramente  aplicando  la  siguiente  generalización  del  teorema  fundamental  visto 
anteriormente: 


Sean  ííi,m2,  . . .  ,un, . . .  una  infinidad  de  soluciones  de  la  EDP  (B.2|  en  una  región  7 Z  del  plano 
XY.  Supongamos  que  la  serie  infinita  un  =  ui  +  u2  +  •  •  •  +  un  +  ■  ■  ■  converge  a  u  en  TZ  y 

que  es  derivable  término  a  término  en  TZ  para  obtener  las  diversas  derivadas  (de  u)  que  aparecen 
en  la  EDP  ( B.2 ) .  La  función  u  (definida  por  u  =  un)  es  también  una  solución  de  la  EDP 

(IB. 21)  en  TZ. 


El  objetivo  es  obtener  una  solución  que  sea  una  serie,  aplicándose  después  las  condiciones  iniciales  del  pro¬ 
blema. 

Señalemos  que  el  procedimiento  así  esquematizado  es  estrictamente  formal.  No  vamos  a  hacer  ningún 
intento  para  justificar  dicho  procedimiento.  En  un  tratamiento  riguroso  se  ha  de  demostrar  que  la  «solución 
formal»  obtenida  satisface  realmente  tanto  la  EDP  como  las  condiciones  suplementarias  y  que  la  solución  así 
justificada  es  la  única  solución  del  problema. 
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Ejemplo:  el  problema  de  difusión 

Ilustraremos  los  principios  esenciales  del  método  de  separación  de  variables  considerando  el  mismo 
problema  que  consideró  Fourier  sobre  la  conducción  de  calor  en  una  varilla  unidimensional  cuyos  extremos 
se  mantienen  a  la  temperatura  constante  de  0o  C  y  la  distribución  de  temperatura  inicial  está  dada  por  la 
función  f(x).  El  modelo  matemático  que  lo  rige  es  el  siguiente  problema  de  contorno  con  condición  inicial: 

Ut  =  0uxx ,  para  0  <  x  <  í  y  t  >  0  (0  =  constante), 

bajo  las  siguientes  condiciones  suplementarias 

w(0,  t)  =  u(f,  t)  =  0,  t>0  (condiciones  de  contorno), 

u(x,0)  =  f(x),  0  <  x  <  i  (condición  inicial). 

La  idea  es  buscar  soluciones  de  la  forma  u(x,t )  =  X(x)T(t ),  para  lo  que  se  ha  de  verificar  la  ecuación 

X"(x)  T'(t ) 

X{x)T\t)  =  0X"{x)T(t),  o  bien,  =  A, 

donde  necesariamente  A  ha  de  ser  una  constante,  que  se  denomina  constante  de  separación.  Por  tanto,  fijando 
A,  se  tienen  las  dos  EDO 

X"{x)  =  \X(x)  y  T\t)  =  0\ T(t). 

Como  u(x,t )  =  X{x)T{t),  las  condiciones  de  contorno  son 

X(0)T(t)  =  0  y  X{l)T{t)  =0,  t>  0, 

de  manera  que  T(f)  =  0,  para  todo  t  >  0,  lo  que  implica  que  u(x ,  t)  =  0,  o  bien 

X(0)  =  X(£)  =  0. 

Ignorando  la  solución  trivial,  se  combinan  estas  últimas  condiciones  de  contorno  con  la  EDO  correspondiente 
a  X(x)  para  obtener  el  problema  de  contorno 

X"(x)  =  AX(x);  A(0)  =  X(t)  =  0,  (B.7) 


donde  A  puede  ser  cualquier  constante. 

Notemos  que  la  función  X(x)  =  0  es  una  solución  para  todo  A  y,  dependiendo  de  la  elección  de  A,  ésta 


puede  ser  la  única  solución  del  problema  de  contorno  (B.7 1.  Así  que  si  se  busca  una  solución  no  trivial 


u{x,t)  =  X{x)T{t)  del  problema  original,  primero  se  deben  determinar  aquellos  valores  de  A  para  los  cuales 
el  problema  de  contorno  (B.7 1  tiene  una  solución  no  trivial.  Dichos  valores  especiales  de  A  se  llaman  valores 


EDO  de  (B.7 1  es 


propios,  y  las  correspondientes  soluciones  no  triviales  son  las  denominadas  funciones  propias. 

Para  resolver  el  problema  de  contorno  (B.7 1,  se  empieza  con  la  ecuación  auxiliar  r2  —  A  =  0  y  se  consideran 
tres  casos: 

Caso  1:  A  >  0.  Las  raíces  de  la  ecuación  auxiliar  son  r  =  ±V A,  de  modo  que  la  solución  general  de  la 

X{x)  =  C\  e^x  +C2  . 

Para  determinar  C\  y  C2,  recurrimos  a  las  condiciones  de  contorno 

X(0)  =  Cx  +  C2  =  0  y  X(£)  =  C1eV^í +C2e~Vlí  =  0. 

de  forma  que  si  C2  =  —  C\,  tenemos  que  Ci  =  0  o  C-i  (e2^e  —l'j  =  0.  Como  hemos 

supuesto  que  A  >  0,  resulta  que  e2v^  —1  >  0.  Por  lo  tanto,  C\  y,  en  consecuencia,  C2  son  iguales  a  cero.  Por 


consiguiente,  no  existe  solución  no  trivial  de  ( B.7 1  para  A  >  0. 


Caso  2:  A  =  0.  Aquí  r  =  0  es  una  raíz  doble  de  la  ecuación  auxiliar  y  la  solución  general  de  la  EDO  es 


entonces 


X(x)  =  Ci  +  C2x. 
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Las  condiciones  de  contorno  dadas  en  (B.7 1  originan  las  ecuaciones  C\  =  0  y  C\+C2 i  =  0,  las  cuales  implican 
que  C±  =  C2  =  0.  Consecuentemente,  para  A  =  0,  no  existe  solución  no  trivial  de  (B.7). 

Caso  3:  A  <  0.  Las  raíces  de  la  ecuación  auxiliar  son  r  =  ±¿v/— A,  de  modo  que  la  solución  general  de  la 
EDO  que  aparece  en  (B.7 1  es 

X(x)  =  Cu  eos  \¡ — A  x  -V  C2  sen  V—Xx. 

Ahora  las  condiciones  de  contorno  de  flBj|  dan  lugar  al  sistema 

C\  =  0,  C\  eos  V— A  í  +  C-2  sen  yf^-X  i  =  0. 

Puesto  que  C\  =  0,  el  sistema  se  reduce  a  resolver  C2  sen  A  í  =  0.  Por  lo  tanto,  sen  y/—X£  =  0  o  C2  =  0. 
Ahora  bien 

sen  V— A  l  =  0  <t=>  V^-Xi  =  mr,  donde  n  es  un  entero. 


Por  consiguiente,  (B.7 1  tiene  una  solución  no  trivial  (C2  ^  0)  cuando  y/—X¿  =  nn  o  A  =  -  {jfY  n  €  N 

Además,  las  soluciones  no  triviales  (funciones  propias)  Xn(x)  correspondientes  al  valor  propio  A  =  —  ( - 
están  dadas  por 


Xn(x)  =  an  sen 


/mrx 

\JT 


G  N, 


donde  los  valores  an  son  constantes  arbitrarias  distintas  de  cero. 

Una  vez  determinado  A  =  —(mr/£)2,  para  algún  entero  positivo  n,  consideremos  la  segunda  EDO  T'(t)  = 
/3XT(t)  con  X  =  —  [^)2;  es  decir, 

cuya  solución  general,  para  cada  n  G  N,  es 


T'V)  +  l3(™yT(t)=0, 


Tn(t)  =  bne~^y~t . 


Combinando  ahora  esta  solución  con  la  anterior,  para  cada  n  G  N,  se  obtiene  la  función 

un(x,t )  =  Xn(x)Tn(t)  =  an  sen  ^  t  =  Cne''^)  ‘gen  j , 

donde  c„  es  una  constante  arbitraria. 

Señalemos  que  cada  una  de  estas  funciones  un  satisface  tanto  la  EDP  como  las  dos  condiciones  de  contorno 
para  todos  los  valores  de  las  constantes  cn  (compruébese  como  ejercicio). 

Hemos  de  intentar  ahora  satisfacer  la  condición  inicial.  En  general,  por  sí  sola,  ninguna  de  las  anteriores 
soluciones  un(x,t)  satisfará  la  condición  inicial.  Por  ejemplo,  si  aplicamos  la  condición  inicial  a  una  solución 
un(x,t),  hemos  de  tener 

(TL7TX  \ 

■  0  <  x  <  í, 

donde  n  es  un  entero  positivo,  y  esto  es  evidentemente  imposible,  a  menos  que  /  sea  una  función  sinusoidal 
de  la  forma  I\  sen  (^-p),  para  algún  entero  positivo  n. 

¿Qué  hemos  de  hacer  entonces?  Según  la  generalización  del  teorema  fundamental  visto  anteriormente, 
suponiendo  la  convergencia  apropiada,  una  serie  infinita  de  soluciones  de  la  EDP  del  problema  original  es 
también  solución.  Formamos  entonces  una  serie  infinita 

OO  OO 

n= 1  n—1 

de  las  soluciones  un(x,t ),  que,  por  la  generalización  del  teorema  fundamental  y  suponiendo  la  convergencia 
apropiada,  nos  asegura  que  la  suma  de  esta  serie  es  también  una  solución  de  la  EDP.  Simbolizando  dicha 
suma  por  u(x,t),  escribimos 


OO  OO  _ 

i(x,t)  =  ^2  un(x,t)  =  ^2  c„e_/3(I7t)  ‘sen  ■ 


(B.8) 


Observamos  que  u(0,t)  =  u(£,t)  =  0,  t  >  0.  Suponiendo  entonces  la  convergencia  apropiada,  la  función 
u(x,t ),  dada  por  (B.8),  satisface  la  EDP  y  las  condiciones  de  contorno. 
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Aplicamos  ahora  la  condición  inicial  a  la  solución  ( B.8  > : 


OO  __ 

f(x)  =  u(x,  0)  =  ^>„  sen  (-j-')  >  0  <  x  <  £. 


n—1 


De  esta  manera,  el  problema  original  de  conducción  de  calor  en  una  varilla  unidimensional  se  ha  reducido 
al  problema  de  determinar  un  desarrollo  de  f(x)  de  la  forma 


/(*)  =  ¿ 


cn  sen 


(n'KX 

IT 


(B.9) 


Un  desarrollo  de  este  tipo  se  llama  serie  senoidal  de  Fourier.  Si  se  eligen  los  cn  de  manera  que  la  igualdad 
anterior  sea  válida,  entonces  el  desarrollo  de  u(x,t ),  dado  por  (B.8),  se  denomina  solución  formal  del 
problema  de  conducción  de  calor  en  una  varilla  unidimensional.  La  teroría  de  las  series  de  Fourier  prueba 
que  tales  cn  son  de  la  forma: 


J  /(s)  sen  ds,  n  =  1,2,... 


Notemos  que  la  solución  (B.8)  es  formal,  ya  que  en  el  proceso  de  su  obtención  hemos  supuesto  una 
convergencia  que  no  hemos  justificado.  Si  este  desarrollo  converge  a  una  función  con  segundas  derivadas 
parciales  continuas,  entonces  la  solución  formal  es  una  solución  verdadera  (genuina).  Además,  la  solución  es 
única. 

Ejemplo.  Encuéntrese  la  solución  del  siguiente  problema  de  difusión 

Ut  =  7 Uxx,  0  <  X  <  7T,  t  >  0, 

u(0,t)  =  u(7T,t)  =0,  t  >  0, 

u(x,  0)  =  3  sen  2a:  —  6  sen  5a:,  0  <  x  <  n. 

Observemos  que  /?  =  7  y  í  =  7r.  Por  tanto,  se  requiere  solo  determinar  los  valores  de  cn  incluidos  en  la  fórmula 
(IB. 91).  Esto  es 


i(x,  0)  =  3  sen  2a:  —  6  sen  5a:  =  cn 


sen  nx. 


Igualando  los  coeficientes  de  términos  semejantes,  se  encuentra  que 

C2  =  3,  C5  =  —  6  y  cn  =  0,  para  todo  n  7^  2,  5. 


Por  consiguiente,  de  (B.8),  se  sigue  que  la  solución  del  anterior  problema  de  difusión  es 
u(x,  i)  :  c2  e-^T)2*  sen  +  c5  e”^)2*  sen 

=  3e-28tsen2x  —  6  e_1 ,5Í  sen  5a;.  □ 


B.6.  Ejercicios 

1.  Hállese  una  solución  que  contenga  dos  funciones  arbitrarias  para  cada  una  de  las  siguientes  EDP. 
Determínese,  para  cada  una  de  ellas,  si  la  EDP  es  hiperbólica,  elíptica  o  parabólica. 

n)  ^^xy  A  -  0,  c)  UXX  A  5‘Uyy  0,  C)  UxX  A  9 Uyy  0, 

b)  “t-  =  0,  d)  Uxx  “t“  ^xy  =  9,  /*)  2'U^X  2 Uxy  ^Uyy  =  0. 

2.  Determínense  y  dibújense  las  regiones  del  plano  para  las  cuales  las  siguientes  EDP  son  de  tipo  hiper¬ 
bólico,  elíptico  o  parabólico. 

a)  uxx  +  x uxy  -  x2y  =  0,  b )  uxx  +  xuxy  -  yuvv  -  xyux  =  0. 
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3.  Transfórmense  las  siguientes  EDP  en  su  forma  canónica  y  resuélvanse  aquellas  que  sean  posibles. 


ü)  «IX  +  4  uxy  —  5  uyy  +  6ux  +  3  uy  —  9u  =  0, 
b)  UXX  —  6uxy  +  9  Uyy  +  2  UX  +  3  uy  —  u  =  0, 

C)  UXX  +  2 UXy  +  5uyy  +  UX  ~  2 Uy  3Zi  =  0, 


d)  V'XX  buxy  T  GUyy  0, 

c)  Uxx  4 Uxy  T  4 Uyy  —  0, 

/)  x2uxx  +  2xyuXy  +  y2uvv  +  xyux  +  y2uy  =  0. 


4.  Utilícese  el  método  de  separación  de  variables  para  resolver  cada  uno  de  los  siguientes  problemas 

a) ut  =  ux ;  u(x,0)  =  ex  +  e~2x, 

b)  ut  =  ux,  u(0,  i)  =  e”3t  +  e2t, 

c)  m*  =  +  u-,  u(x,  0)  =  2e~x  —  e2x, 

d)  ut  =  ux  —  u ;  u( 0,  t)  =  e-5í  +  2e~7t  —  14e13í. 

5.  Determínese  si  se  puede  utilizar  el  método  de  separación  de  variables  para  resolver  las  siguientes  EDP. 

Q.)  tutt  4“  Ux  —  0,  6)  tuxx  T  X'Ut  —  0,  c)  Uxx  T  i^X  y^^yy  —  «xx  4”  ^Mxy  4“  Uy  —  0- 


6.  Resuélvanse  los  siguientes  problemas 


o)  ut  =  (1-71)  uxx ; 

&)  ut  =  (1-14)  uxx\ 


,  .  nx  n  57ra; 

0)  =  sen  —  +  3 sen  — , 

u(0,t)  =  u(2,t)  =0,  t  >  0. 

7TX 

u( x,  0)  =  sen  — - 3  sen  2wx, 

u( 0,  t)  =  u(2,  t)  =  0,  t  >  0. 


0  <  x  <  2, 

0  <  x  <  2, 


7.  El  problema  de  la  cuerda  vibrante  m )•  Apliqúese  el  método  de  separación  de  variables  para  encontrar 
una  solución  formal  del  problema  de  la  cuerda  vibrante,  que  analiza  las  vibraciones  transversales  de 
una  cuerda  sujeta  entre  dos  puntos,  tal  como  una  cuerda  de  guitarra  o  de  piano.  Consideremos  una 
cuerda  elástica  tensa  cuyos  extremos  están  fijos  al  eje  X  en  los  puntos  x  =  0  y  x  =  í.  Supongamos 
que  para  cada  x  en  el  intervalo  0  <  x  <  i  la  cuerda  se  desplaza  en  el  plano  XY,  siendo  conocido  el 
desplazamiento  a  partir  del  eje  X ,  dado  por  la  función  f{x).  Supongamos  también  que  en  t  =  0  se 
abandona  la  cuerda,  a  partir  de  la  posición  inicial  dada  por  f(x),  con  una  velocidad  inicial  en  cada 
punto  del  intervalo  0  <  x  <  £  dada  por  g{x).  El  movimiento  de  dicha  cuerda  se  rige  por  el  siguiente 
problema  de  contorno  con  condiciones  iniciales: 


utt  =  oí2  uxx,  0  <  x  <  í,  t>  0, 
m(0,  i)  =  it(£,  t)  =  0,  t  >  0, 

< 

u(x,  0)  =  f{x),  0  <  x  <  l, 

ut(x, 0)  =  g{x),  0  <  x  <  í. 


Como  caso  particular  del  problema  de  la  cuerda  vibrante  resuélvase  el  siguiente  problema  (US])-  Su¬ 
pongamos  que  la  cuerda  es  tal  que  la  constante  a2  =  4  y  que  los  extremos  están  fijos  al  eje  X  en  x  =  0 
y  x  =  7r.  La  distancia  al  eje  X  en  el  intervalo  0  <  x  <  ir  está  dada  por  f(x)  =  sen  3a;  —  4  sen  10a;.  La 
velocidad  inicial  en  cada  punto  del  intervalo  0  <  x  <  tt  con  que  se  abandona  la  cuerda  a  partir  de  la 
posición  inicial  es  g{ x)  =  2  sen  4a;  +  sen  6a;. 

8.  Resuélvanse  los  siguientes  problemas 

Íu(x,  0)  =  6  sen  2a;  +  2  sen  6a;,  0  <  x  <  n, 

ut(x,  0)  =  11  sen  9a;  —  14  sen  15a;,  0  <  x  <  n, 

u( 0,  t )  =  u(tt,  t)  =  0,  t  >  0. 
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Íu(x,0)  =  y/1  —  cosx,  0  <  x  <  2n, 
ut(x,  0)  =  0,  0  <  x  <  2n, 

u(0,t)  =  u(2n,t)  =  0,  t  >  0. 

9.  Apliqúese  el  método  de  separación  de  variables  para  resolver  el  problema 

(  u(x,  0)  =  3sen(27nr)  —  7  sen(47ra;),  0  <  x  <  10, 

ut  =  uxx  +  U]  { 

[  u(0,t)  =  íí(10,í)  =  0,  t  >  0. 

10.  La  ecuación  bidimensional  de  Laplace  (ES!).  Apliqúese  el  método  de  separación  de  variables  para 
encontrar  una  solución  formal  de  la  ecuación  bidimensional  de  Laplace.  En  dos  dimensiones,  el  potencial 
gravitatorio  newtoniano  y  el  potencial  electrostático  vienen  descritos  por  la  ecuación  uxx  +  uyy  =  0.  La 
ecuación  bidimensional  del  calor,  ut  =  (3{uxx  +  Uyy),  también  se  reduce  a  ella  para  el  caso  estacionario, 
ya  que  Ut  =  0.  También  es  una  ecuación  que  aparece  en  hidrodinámica  y  en  elasticidad.  En  estas 
circunstancias,  en  vez  de  dar  la  distribución  inicial  de  temperaturas  f{x)  a  lo  largo  de  la  barra,  como 
se  hizo  en  el  problema  de  difusión,  se  da  la  distribución  de  temperaturas  en  la  frontera  de  la  región  D 
donde  se  satisface  la  ecuación  de  Laplace.  Encuéntrese  la  solución  de  la  ecuación 

'Uxx  T  'Uyy  ~  0 

en  la  región  D  =  {(a:,  y)/  0  <  x  <  a,  0  <  y  <  6},  con  las  cuatro  condiciones  de  contorno 

it(x,0)  =  0,  u(x,b)  =  f(x),  0  <  x  <  a, 
u{ 0,  y)  =  0,  u(a,  y)  =  0,  0  <  y  <  b. 

Este  problema  se  conoce  como  problema  de  Dirichlet. 

11.  Hállese  el  potencial  en  la  placa  metálica 

D  =  {(x,y)/  0  <  x  <  a,  0  <  y  <  b} 


con  las  condiciones  de  contorno 

z¿(0,y)  =  0,  u(a,y)  =  0,  u(x,  0)  =  0,  u(x,  6)  =  2  sen 

12.  La  ecuación  bidimensional  del  calor  es  de  la  forma 

Ut  =  (Ó{UXX  +  Uyy). 

Suponiendo  que  u(x,y,t)  =  X(x)Y(y)T(t ),  obténganse  EDO  para  A,  Y  y  T.  Hállense  las  soluciones 
que  satisfagan  las  condiciones 

u(0,y,t)=0,  u(a,y,t)  =  0,  u(x,  0,  t)  =  0,  u(x,b,t)  =  0. 


13.  Obténgase  la  ecuación  bidimensional  de  Laplace  en  coordenadas  polares. 


Bibliografía  básica 

[1]  A.  Aubanell,  A.  Benseny  y  A.  Delshams,  Útiles  básicos  de  cálculo  numérico,  Labor,  Barcelona,  1993. 

[2]  R.  B.  Bhat  y  S.  Clrakraverty,  Numerical  analysis  in  engineering,  Alpha  Science,  Oxford,  2007. 

[3]  R.  L.  Burden  y  J.  D.  Faires,  Análisis  numérico,  7a  edición,  Thompson,  Madrid,  2003. 

[4]  S.  C.  Chapra  y  R.  P.  Canale,  Métodos  numéricos  para  ingenieros,  McGraw-Hill  Interamericana,  México, 

2007. 

[5]  A.  Cordero,  J.  L.  Hueso,  E.  Martínez  y  J.  R.  Torregrosa,  Problemas  resueltos  de  métodos  numéricos, 
Thomson,  Madrid,  2006. 

[6]  V.  Domínguez  y  M.  L.  Rapún,  Matlab  en  cinco  lecciones  de  numérico,  Universidad  Pública  de  Navarra, 
Pamplona,  2007. 

[7]  J.  D.  Faires  y  R.  Burden,  Métodos  numéricos,  3a  edición,  Thomson,  Madrid,  2004. 

[8]  L.  V.  Fausett,  Applied  numerical  analysis  using  Matlab,  2ncl  edition,  Pearson  Prentice  Hall,  New  Jersey, 

2008. 

[9]  I.  A.  García  y  S.  Maza,  Métodos  numéricos,  Edicions  de  la  Universitat  de  Lleida,  Lleida,  2009. 

[10]  F.  García  y  A.  Nevot,  Métodos  numéricos  en  forma  de  ejercicios  resueltos,  Universidad  Pontificia  Comillas 
de  Madrid,  Madrid,  1997. 

[11]  C.  F.  Gerald  y  P.  O.  Wheatley,  Análisis  numérico  con  aplicaciones,  6a  edición,  Pearson  Educación, 
México,  2000. 

[12]  A.  Gilat  y  V.  Subramaniam,  Numerical  methods  for  engineers  and  scientists:  an  introduction  with 
applications  using  MatLab,  John  Wiley  and  Sons,  New  Jersey,  2008. 

[13]  P.  Holoboroclko,  Applied  mathematics  and  beyond:  numerical  methods.  Disponible  en 

http :  //www .  holoborodko  .  com/pavel/numerical-methods/numerical-  “/O20integration/ 

[14]  J.  A.  Infante  y  J.  M.  Rey,  Métodos  numéricos,  3a  edición,  Pirámide,  Madrid,  2007. 

[15]  E.  Isaacson  y  H.  B.  Keller,  Analysis  of  numerical  methods,  2nd  edition,  John  Wiley  &  Sons,  New  York, 
1990. 

[16]  A.  Kharab  y  R.  B.  Guenther,  An  introduction  to  numerical  methods:  a  Matlab  approach,  Chapman  and 
Hall/CRC,  Boca  Ratón,  2006. 

[17]  D.  Kincaid  y  W.  Cheney,  Análisis  numérico:  las  mátemáticas  del  cálculo  científico,  Addison-Wesley 
Iberoamericana,  Buenos  Aires,  1994. 

[18]  J.  H.  Mathews  y  K.  D.  Fink,  Métodos  numéricos  con  MATLAB,  3a  edición,  Prentice  Hall,  Madrid,  1999. 

[19]  R.  K.  Nagle  y  E.  B.  Saff,  Fundamentos  de  ecuaciones  diferenciales,  Addison-Wesley  Iberoamericana, 
Delaware,  1992. 

[20]  D.  Prasad,  An  introduction  to  numerical  analysis,  Alpha  Science,  Oxford,  2006. 


131 


132 


Bibliografía  básica 


[21]  S.  L.  Ross,  Ecuaciones  diferenciales,  Reverté,  Barcelona,  1979. 

[22]  A.  Quarteroni,  R.  Sacco  y  F.  Saleri,  Numerical  Mathematics,  2nd  edition,  Springer-Verlag,  New  York, 
2007. 

[23]  A.  Quarteroni  y  F.  Saleri,  Cálculo  científico  con  MATLAB  y  Octave,  Springer-Verlag  Italia,  Milano, 
2006. 

[24]  J.  M.  Quesada,  C.  Sánchez,  J.  Jódar  y  J.  Martínez,  Análisis  y  métodos  numéricos,  Universidad  de  Jaén, 
Jaén,  2004. 

[25]  V.  Ramírez,  D.  Barrera,  M.  Posadas  y  P.  González,  Cálculo  numérico  con  Mathematica,  Ariel,  Barcelona, 

2001. 

[26]  J.  San  Martín,  V.  Torneo  y  I.  Uña,  Métodos  matemáticos,  Thomson,  Madrid,  2005. 

[27]  J.  M.  Sanz-Serna,  Diez  lecciones  de  cálculo  numérico,  Universidad  de  Valladolid,  Valladolid,  1998. 

[28]  E.  Steiner,  Matemáticas  para  las  ciencias  aplicadas,  Reverté,  Barcelona,  2005. 


Bibliografía  complementaria 


•  K.  E.  Atkinson,  An  introduction  to  numerical  analysis,  John  Wiley  &  Sons,  New  York,  1989. 

•  J.  C.  Butcher,  Numerical  methods  for  ordinary  differential  equations,  2nd  edition,  John  Wiley  &  Sons, 

Chichester,  2008. 

•  S.  D.  Conte  y  C.  de  Boor,  Análisis  numérico  elemental:  un  enfoque  algorítmico,  McGraw-Hill,  New  York, 

1974. 

•  G.  Dahlquist  y  Á.  Bjórck,  Numerical  methods,  Prentice-Hall,  New  Jersey,  1974. 

•  P.  J.  Davis,  Interpolation  and  approximation,  Dover,  New  York,  1975. 

•  P.  J.  Davis  y  P.  Rabinowitz,  Methods  of  numerical  integration,  2nd  edition,  Dover,  New  York,  2007. 

•  A.  J.  Davis,  The  finite  element  method:  an  introduction  with  partial  differential  equations,  Oxford  Uni- 

versity  Press,  Oxford,  2011. 

•  C.  De  Boer,  A  practical  guide  to  splines,  revisecl  edition,  Springer-Verlag,  New  York,  2001. 

•  P.  Deuflharcl  y  A.  Hohmann,  Numerical  analysis  in  modern  scientific  computation:  an  introduction,  2nd 

edition,  Springer-Verlag,  New  York,  2003. 

•  J.  F.  Epperson,  An  introduction  to  numerical  methods  and  analysis,  John  Wiley  &  Sons,  New  Jersey,  2007. 

•  L.  Fox,  Numerical  solution  of  two-point  boundary  valué  problem  in  ordinary  differential  equations,  Dover, 

New  York,  1990. 

•  M.  Gasea,  Cálculo  numérico  I,  Publicaciones  de  la  UNED,  Madrid,  1991. 

•  W.  Gautschi,  Numerical  analysis:  an  introduction,  Birkháuser,  Boston,  1997. 

•  C.  W.  Gear,  Numerical  initial  valué  problems  in  ordinary  differential  equations,  Prentice  Hall,  Englewood 

Cliffs,  NJ,  1971. 

•  C.  F.  Gerald  y  P.  O.  Wheatley,  Applied  numerical  analysis,  Acldison-Wesley,  New  York,  1994. 

•  M.  S.  Gockenbach,  Partial  differential  equations:  analytical  and  numerical  methods,  SIAM,  Philadelphia, 

2011. 

•  G.  H.  Golub  y  J.  M.  Ortega,  Scientific  computing  and  differential  equations:  an  introduction  to  numerical 

methods,  Academic  Press,  London,  1992. 

•  G.  H.  Golub  y  C.  F.  Van  Loan,  Matrix  computations,  3rcl  edition,  Johns  Hopkins  University  Press,  Balti¬ 

more,  1996. 

•  C.  Grossmann,  H.-G.  Roos  y  M.  Stynes,  Numerical  treatement  of  partial  differential  equations,  Springer- 

Verlag,  Berlin  Heidelberg,  2007. 

•  W.  W.  Hager,  Applied  numerical  linear  algebra,  Prentice  Hall,  Englewood  Cliffs,  NJ,  1988. 

•  G.  Hámmerling  y  K.-H.  Hoffmann,  Numerical  mathematics,  Springer-Verlag,  New  York,  1991. 


133 


134 


Bibliografía  complementaria 


•  N.  J.  Higham,  Accuracy  and  stability  of  numerical  methods,  SIAM,  Philadelphia,  2002. 

•  H.  Keller,  Numerical  methods  for  two-point  boundary  valué  problems,  Dover,  New  York,  1992. 

•  J.  D.  Lambert,  Numerical  methods  for  ordinary  differential  Systems:  the  initial  valué  problem,  John  Wiley 

&  Sons,  Chichester,  1991. 

•  P.  Lancaster  y  K.  Salkaukas,  Curve  and  surface  fitting:  an  introduction,  Academic  Press,  Boston,  1986. 

•  S.  Larsson  y  V.  Thomée,  Partial  differential  equations  with  numerical  methods,  Springer-Verlag,  Berlín 

Heidelberg,  2003. 

•  G.  G.  Lorentz,  Approximation  of  functions,  American  Mathematical  Society,  Providence,  2005. 

•  J.  M.  Ortega  y  W.  C.  Reinboldt,  Iterative  solution  of  nonlinear  equations  in  several  variables,  SIAM, 

Philadelphia,  2000. 

•  A.  Ralston  y  P.  Rabinowitz,  A  first  course  in  numerical  analysis,  2nd  edition,  Dover,  New  York,  2001. 

•  J.  Stoer  y  R.  Bulirsch,  Introduction  to  numerical  analysis,  3rcl  edition,  Springer-Verlag,  New  York,  2002. 

•  C.  W.  Ueberhuber,  Numerical  computation:  methods,  software,  and  analysis,  Springer-Verlag,  Berlin  Hei¬ 

delberg,  1997. 

•  R.  S.  Varga,  Matrix  iterative  analysis,  2nd  edition,  Springer-Verlag,  Berlin  Heidelberg,  2000. 

•  J.  H.  Wilkinson,  Rounding  errors  in  algebraic  process,  Dover,  New  York,  1994. 

•  Mathematica  documentation  center.  Disponible  en 

http : //ref erence . wolfram. com. 

•  Mathworks  documentation  center.  Disponible  en 

http : //www .mathworks . es/help/documentation-center . html. 


UNIVERSIDAD 
DE  LARIOJA 


Servicio  de  Publicaciones 
Biblioteca  Universitaria 
C/  Piscinas,  s/n 
26006  Logroño  (La  Rioja) 
Teléfono:  941  299 187 

http://publicaciones.unirioja.es 

www.unirioja.es 


